ANOVA Nedir? Varyans Analizi (Analysis of Variance) Rehberi
ANOVA (Analysis of Variance), iki veya daha fazla grup ortalaması arasında istatistiksel olarak anlamlı bir fark olup olmadığını belirlemek amacıyla kullanılan parametrik bir hipotez testidir. Türkçe karşılığı varyans analizi olan bu yöntem, kalite mühendisliği, üretim süreçlerinin iyileştirilmesi, deneysel tasarım (DOE) ve Six Sigma projelerinde en sık başvurulan istatistiksel araçlardan biridir.
Bir üretim hattında üç farklı makinenin aynı ürünü ürettiğini düşünün. Her makineden alınan ölçüm değerlerinin ortalaması farklı görünüyor olabilir; ancak bu fark gerçekten anlamlı mı, yoksa rastgele değişkenliklerin bir sonucu mu? İşte ANOVA tam olarak bu soruyu yanıtlar.
Varyans Analizi Neden Gereklidir?
İki grup karşılaştırmak için t-testi kullanılabilir. Ancak üç veya daha fazla grup söz konusu olduğunda, tekrarlı t-testleri uygulamak Tip I hata (alfa hatası) olasılığını önemli ölçüde artırır. Örneğin üç grubu ikili olarak karşılaştırdığınızda 3 ayrı t-testi yapmanız gerekir ve her testte %5 hata riski varken, toplamda bu oran %14'e kadar çıkar.
ANOVA, tüm grupları aynı anda tek bir test ile değerlendirerek bu çoklu karşılaştırma sorununu ortadan kaldırır. Böylece alfa hatasını kontrol altında tutar ve daha güvenilir sonuçlar elde edilir.
ANOVA Ne Zaman Kullanılır?
- Üç veya daha fazla grubun ortalamasını karşılaştırmak istediğinizde
- Bağımsız değişken kategorik (nominal veya ordinal), bağımlı değişken sürekli (interval veya rasyo) olduğunda
- Farklı tedavi, makine, materyal veya proses koşullarının sonuç üzerindeki etkisini ölçmek istediğinizde
- Deneysel tasarım (DOE) çalışmalarında faktör etkilerini analiz ederken
- Six Sigma projelerinde Analyze (Analiz Et) aşamasında kök neden araştırırken
ANOVA Türleri
ANOVA, karıştırılacak faktör sayısına göre farklı türlere ayrılır. En yaygın kullanılanları tek yönlü ve çift yönlü ANOVA'dır.
Tek Yönlü ANOVA (One-Way ANOVA)
Tek yönlü ANOVA, bir bağımsız değişkenin (faktörün) bağımlı değişken üzerindeki etkisini inceler. Faktörün iki veya daha fazla düzeyi (seviyesi) vardır.
Örnek: Üç farklı tedarikçi (A, B, C) tarafından sağlanan hammaddenin, ürünün çekme dayanımı üzerindeki etkisini araştırmak.
- Bağımsız değişken (faktör): Tedarikçi (3 düzey: A, B, C)
- Bağımlı değişken: Çekme dayanımı (MPa)
Hipotezler:
- H0 (Sıfır hipotezi): Tüm grup ortalamaları eşittir (μA = μB = μC)
- H1 (Alternatif hipotez): En az bir grup ortalaması diğerlerinden farklıdır
Çift Yönlü ANOVA (Two-Way ANOVA)
Çift yönlü ANOVA, iki bağımsız değişkenin (faktörün) bağımlı değişken üzerindeki etkisini ve bu iki faktörün birbirleriyle etkileşimini (interaction) aynı anda inceler.
Örnek: Hem tedarikçi (A, B, C) hem de üretim vardiyası (Sabah, Akşam) değişkenlerinin ürün kalitesi üzerindeki etkisini araştırmak.
Bu analiz üç ayrı soruyu yanıtlar:
- Faktör A'nın ana etkisi: Tedarikçiler arasında anlamlı fark var mı?
- Faktör B'nin ana etkisi: Vardiyalar arasında anlamlı fark var mı?
- Etkileşim etkisi: Tedarikçi ve vardiya birlikte ele alındığında farklı bir etki oluşturuyor mu?
Diğer ANOVA Türleri
| ANOVA Türü | Açıklama | Kullanım Alanı |
|---|---|---|
| Tek Yönlü ANOVA | 1 faktör, 2+ düzey | Temel grup karşılaştırması |
| Çift Yönlü ANOVA | 2 faktör, etkileşim analizi | DOE, faktöriyel deneyler |
| Tekrarlı Ölçümlü ANOVA | Aynı deneklerden tekrarlı ölçüm | Tedavi öncesi-sonrası çalışmalar |
| MANOVA | Birden fazla bağımlı değişken | Çok değişkenli analizler |
| ANCOVA | Kovaryansların kontrolü | Ortak değişken etkisini arındırma |
| Nested ANOVA | Hiyerarşik faktör yapısı | İç içe gruplu deneyler |
ANOVA Tablosu ve Bileşenleri
ANOVA'nın çıktısı, standart bir ANOVA tablosu şeklinde sunulur. Bu tablodaki her bir bileşen, analizin temelini oluşturur.
ANOVA Tablosu Örneği
Aşağıda üç makinenin (A, B, C) ölçüm değerleri üzerinden hesaplanmış örnek bir tek yönlü ANOVA tablosu bulunmaktadır:
| Kaynak (Source) | Serbestlik Derecesi (df) | Kareler Toplamı (SS) | Ortalama Kare (MS) | F Oranı | p Değeri |
|---|---|---|---|---|---|
| Gruplar Arası (Between) | 2 | 112.40 | 56.20 | 8.94 | 0.004 |
| Gruplar İçi (Within) | 12 | 75.50 | 6.29 | - | - |
| Toplam (Total) | 14 | 187.90 | - | - | - |
Tablodaki Her Bileşeni Anlama
Kareler Toplamı (SS - Sum of Squares): Değişkenliğin kaynaklarını sayısallaştırır.
- SS Between (Gruplar Arası): Grup ortalamaları arasındaki farklardan kaynaklanan değişkenlik. Faktör etkisini temsil eder.
- SS Within (Gruplar İçi): Her grubun kendi içindeki bireysel değişkenlik. Rastgele hata veya doğal varyasyonu temsil eder.
- SS Total: Tüm veri setindeki toplam değişkenlik (SS Between + SS Within).
Serbestlik Derecesi (df - Degrees of Freedom): Bağımsız bilgi parçası sayısını ifade eder.
- df Between: k - 1 (k = grup sayısı). Örnekte 3 - 1 = 2.
- df Within: N - k (N = toplam gözlem sayısı). Örnekte 15 - 3 = 12.
- df Total: N - 1. Örnekte 15 - 1 = 14.
Ortalama Kare (MS - Mean Square): Kareler toplamının serbestlik derecesine bölünmesiyle elde edilir.
- MS Between: SS Between / df Between = 112.40 / 2 = 56.20
- MS Within: SS Within / df Within = 75.50 / 12 = 6.29
F Oranı (F Ratio): ANOVA'nın test istatistiğidir.
- F = MS Between / MS Within = 56.20 / 6.29 = 8.94
- F değeri ne kadar büyükse, gruplar arası fark o kadar belirgindir.
- Eğer gruplar arasında hiçbir fark olmasaydı, F değeri 1'e yakın olurdu.
p Değeri (p-value): F oranına karşılık gelen olasılık değeridir.
- p < 0.05 ise sonuç istatistiksel olarak anlamlıdır; H0 reddedilir.
- p >= 0.05 ise yeterli kanıt yoktur; H0 reddedilemez.
- Örnekte p = 0.004 < 0.05 olduğundan, makineler arasında anlamlı fark vardır.
F Testi ve p Değeri Yorumlama
F testi, ANOVA'nın kalbinde yer alan istatistiksel testtir. Fisher'ın geliştirdiği F dağılımına dayanan bu test, iki varyans tahminini karşılaştırır.
F Testi Nasıl Çalışır?
- Sıfır hipotezi altında (tüm grup ortalamalarının eşit olduğu varsayımı), MS Between ve MS Within benzer büyüklükte olmalıdır; dolayısıyla F oranı yaklaşık 1 olmalıdır.
- Eğer gruplar arasında gerçek bir fark varsa, MS Between büyüyecek ve F oranı 1'den belirgin şekilde büyük olacaktır.
- Hesaplanan F değeri, kritik F değeri (F tablosundan veya yazılımdan elde edilen) ile karşılaştırılır.
p Değeri Yorumlama Rehberi
| p Değeri Aralığı | Yorum | Karar |
|---|---|---|
| p < 0.01 | Çok güçlü kanıt | H0 kesinlikle reddedilir |
| 0.01 <= p < 0.05 | Güçlü kanıt | H0 reddedilir |
| 0.05 <= p < 0.10 | Zayıf kanıt | Sınırda, dikkatli yorum gerekir |
| p >= 0.10 | Yetersiz kanıt | H0 reddedilemez |
Önemli Not: İstatistiksel anlamlılık ile pratik anlamlılık aynı şey değildir. p değeri küçük olsa bile, etki büyüklüğü (effect size) küçükse sonuç pratikte önemli olmayabilir. Bu nedenle eta-kare veya omega-kare gibi etki büyüklüğü ölçütleri de raporlanmalıdır.
ANOVA Varsayımları
ANOVA'nın geçerli sonuçlar üretebilmesi için bazı varsayımların karşılanması gerekir. Bu varsayımlar ihlal edildiğinde sonuçların güvenilirliği azalır.
1. Normallik (Normality)
Her grubun verisi yaklaşık olarak normal dağılım göstermelidir. Bu varsayım, özellikle küçük örneklem büyüklüklerinde önemlidir.
Kontrol Yöntemleri:
- Shapiro-Wilk testi
- Kolmogorov-Smirnov testi
- Q-Q plot (normal olasılık grafiği)
- Histogram incelemesi
İhlal Durumunda: Non-parametrik alternatif olan Kruskal-Wallis testi uygulanabilir.
2. Varyans Homojenliği (Homogeneity of Variance)
Tüm grupların varyansları yaklaşık olarak eşit olmalıdır. Bu varsayıma "homoscedasticity" de denir.
Kontrol Yöntemleri:
- Levene testi (en yaygın kullanılan)
- Bartlett testi (normallik varsayımına duyarlı)
- Residual plot (artık grafiği)
İhlal Durumunda: Welch ANOVA veya Brown-Forsythe testi gibi robust alternatifler tercih edilebilir.
3. Bağımsızlık (Independence)
Gözlemler birbirinden bağımsız olmalıdır. Bir ölçümün değeri, başka bir ölçümün değerini etkilememelidir.
Sağlanması Gereken Koşullar:
- Rastgele örnekleme
- Grupların birbirinden bağımsız oluşturulması
- Tekrarlı ölçümlerin bulunmaması (tekrarlı ölçüm varsa, Repeated Measures ANOVA kullanılmalıdır)
Pratik Uygulama: Üç Makinenin Karşılaştırılması
Kalite mühendisliğinde ANOVA'nın gerçek dünya uygulamasını somut bir örnek üzerinden inceleyelim.
Senaryo
Bir üretim tesisinde A, B ve C olmak üzere üç farklı CNC tezgahı aynı parçanın çapını işliyor. Kalite mühendisi, bu üç makinenin ürettiği parçaların çap değerlerinin istatistiksel olarak farklı olup olmadığını incelemek istiyor. Her makineden 5'er parça ölçülmüştür.
Veriler (Çap Ölçümü, mm)
| Gözlem | Makine A | Makine B | Makine C |
|---|---|---|---|
| 1 | 50.2 | 49.8 | 51.1 |
| 2 | 50.5 | 50.1 | 50.8 |
| 3 | 50.3 | 49.9 | 51.3 |
| 4 | 50.1 | 50.3 | 50.9 |
| 5 | 50.4 | 49.9 | 51.4 |
| Ortalama | 50.30 | 50.00 | 51.10 |
Analiz Adımları
Adım 1: Hipotezleri Kur
- H0: μA = μB = μC (Üç makinenin ortalaması eşittir)
- H1: En az bir makine ortalaması farklıdır
Adım 2: Varsayımları Kontrol Et
- Normallik: Her grupta 5 gözlem var, küçük örneklem. Shapiro-Wilk testi uygulanır.
- Varyans homojenliği: Levene testi ile kontrol edilir.
- Bağımsızlık: Farklı makinelerden bağımsız ölçümler alınmıştır.
Adım 3: ANOVA Tablosunu Hesapla
| Kaynak | df | SS | MS | F | p |
|---|---|---|---|---|---|
| Gruplar Arası | 2 | 3.043 | 1.522 | 24.54 | 0.0001 |
| Gruplar İçi | 12 | 0.744 | 0.062 | - | - |
| Toplam | 14 | 3.787 | - | - | - |
Adım 4: Karar Ver
F(2,12) = 24.54, p = 0.0001 < 0.05
Sonuç: H0 reddedilir. Üç makine arasında istatistiksel olarak anlamlı bir fark vardır. Kalite mühendisi, hangi makinenin farklı olduğunu belirlemek için post-hoc test uygulamalıdır.
Sonuçların Yorumu
ANOVA sonucu, makineler arasında anlamlı fark olduğunu göstermektedir; ancak hangi makine çiftinin farklı olduğunu söylemez. Tablodaki ortalamalara baktığımızda Makine C'nin değerlerinin belirgin şekilde yüksek olduğu görülmektedir. Bu durum, Makine C'nin kalibrasyon ayarının kontrol edilmesi gerektiğine işaret eder.
Post-Hoc Testler
ANOVA istatistiksel olarak anlamlı bir sonuç verdiğinde (p < 0.05), hangi grupların birbirinden farklı olduğunu belirlemek için post-hoc (çoklu karşılaştırma) testleri uygulanır.
Yaygın Post-Hoc Testleri
| Test | Özellik | Ne Zaman Kullanılır |
|---|---|---|
| Tukey HSD | Tüm ikili karşılaştırmalar | Eşit örneklem büyüklükleri |
| Bonferroni | Alfa düzeltmesi uygular | Az sayıda planlanmış karşılaştırma |
| Scheffe | En muhafazakar test | Karmaşık kontrastlar |
| Dunnett | Kontrol grubuna karşılaştırma | Bir referans grubunuz varsa |
| Games-Howell | Eşit olmayan varyanslar | Varyans homojenliği sağlanmıyorsa |
Yukarıdaki örnekte Tukey HSD testi uygulandığında, Makine C'nin hem Makine A'dan hem de Makine B'den istatistiksel olarak anlamlı derecede farklı olduğu; ancak Makine A ile Makine B arasında anlamlı fark olmadığı belirlenir.
Size Uygun Eğitimi Bulun
Bireysel mi yoksa kurumsal mı eğitim arıyorsunuz?
ANOVA, t-Testi ve Ki-Kare Karşılaştırması
Farklı istatistiksel testlerin ne zaman kullanılacağını bilmek, doğru analiz yöntemini seçmek için kritik öneme sahiptir.
| Özellik | t-Testi | ANOVA | Ki-Kare Testi |
|---|---|---|---|
| Amaç | 2 grup ortalaması karşılaştırma | 2+ grup ortalaması karşılaştırma | Kategorik değişkenler arası ilişki |
| Bağımlı Değişken | Sürekli (nicel) | Sürekli (nicel) | Kategorik (nitel) |
| Bağımsız Değişken | Kategorik (2 düzey) | Kategorik (2+ düzey) | Kategorik |
| Test İstatistiği | t değeri | F değeri | Ki-kare değeri |
| Varsayımlar | Normallik, bağımsızlık | Normallik, varyans homojenliği, bağımsızlık | Beklenen frekans >= 5 |
| Örnek | Erkek vs kadın boy farkı | 3 ilaç dozunun etkisi | Cinsiyet ile tercih ilişkisi |
| Non-parametrik Alternatif | Mann-Whitney U | Kruskal-Wallis | Fisher Kesin Testi |
Not: İki grup karşılaştırıldığında ANOVA ve bağımsız örneklem t-testi aynı sonucu verir. Bu durumda F = t-kare ilişkisi geçerlidir.
ANOVA ve Deney Tasarımı (DOE) Bağlantısı
Deney Tasarımı (Design of Experiments - DOE), ANOVA'nın en güçlü uygulama alanlarından biridir. DOE'de faktörler sistematik olarak değiştirilerek bağımlı değişken üzerindeki etkileri ANOVA ile analiz edilir.
DOE'de ANOVA'nın Rolü
- Faktöriyel Deneylerde: 2^k veya 3^k faktöriyel tasarımlarda ana etkiler ve etkileşimler ANOVA tablosu ile değerlendirilir.
- Taguchi Yönteminde: Sinyal-gürültü oranlarının analizi için ANOVA uygulanır.
- Yanıt Yüzey Yönteminde (RSM): İkinci dereceden model anlamlılığı ANOVA ile test edilir.
Endüstriyel Uygulama Örneği
Bir enjeksiyon kalıplama prosesinde sıcaklık (3 seviye), basınç (3 seviye) ve soğutma süresi (3 seviye) faktörlerinin parça çarpıklığına etkisi araştırılmak istendiğinde, 3^3 = 27 deney koşulu oluşturulur. Çift yönlü (veya çok faktörlü) ANOVA ile:
- Hangi faktörün en büyük etkiye sahip olduğu
- Faktörler arası etkileşim olup olmadığı
- Optimal faktör seviye kombinasyonu belirlenir
ANOVA ve Six Sigma
Six Sigma metodolojisinin DMAIC döngüsü içinde ANOVA, özellikle Analyze (Analiz Et) ve Improve (İyileştir) aşamalarında kritik bir rol oynar.
DMAIC Döngüsünde ANOVA Kullanımı
Measure (Ölç) Aşaması:
- Ölçüm sistemi analizinde (MSA/Gage R&R) operatörler arası farklılık ANOVA ile değerlendirilir.
Analyze (Analiz Et) Aşaması:
- Potansiyel kök nedenlerin istatistiksel olarak anlamlı olup olmadığı ANOVA ile test edilir.
- Örneğin: "Farklı vardiyalarda üretilen parçaların hata oranı farklı mı?" sorusu tek yönlü ANOVA ile yanıtlanır.
Improve (İyileştir) Aşaması:
- DOE sonuçlarının analizi için ANOVA kullanılır.
- Yeni proses parametrelerinin eski parametrelerden istatistiksel olarak farklı olduğu doğrulanır.
Control (Kontrol Et) Aşaması:
- İyileştirme sonrası doğrulamada, eski ve yeni proses performanslarının karşılaştırması yapılabilir.
Kalite Araçlarından Diğer Bağlantılar
ANOVA, izole bir araç değil; daha geniş bir istatistiksel analiz ekosisteminin parçasıdır:
- SPC (İstatistiksel Proses Kontrol): Kontrol dışı sinyaller ANOVA ile doğrulanabilir.
- Regresyon Analizi: Regresyon modelinin anlamlılığı ANOVA tablosu ile test edilir.
- Proses Yeterliliği (Cp, Cpk): ANOVA sonucu anlamlı fark bulunursa, her grubun yeterlilik indeksleri ayrı ayrı hesaplanır.
ANOVA Analizinde Yaygın Hatalar
ANOVA uygularken dikkat edilmesi gereken kritik noktalar şunlardır:
- Varsayımları kontrol etmemek: Normallik ve varyans homojenliği testleri atlandığında sonuçlar yanıltıcı olabilir.
- Çoklu t-testi yerine ANOVA kullanmamak: Üç veya daha fazla grup için tekrarlı t-testleri alfa enflasyonuna neden olur.
- Post-hoc test uygulamamak: ANOVA anlamlı çıkmış olsa bile, hangi grupların farklı olduğunu belirlemeden yorum yapmak eksik kalır.
- Örneklem büyüklüğünü ihmal etmek: Küçük örneklemler düşük istatistiksel güce yol açar; anlamlı farklar tespit edilemeyebilir.
- Etki büyüklüğünü raporlamamak: Sadece p değerine odaklanmak, pratik anlamın gözden kaçırılmasına neden olur.
- Bağımsızlık varsayımını ihlal etmek: Tekrarlı ölçümleri bağımsız gözlem gibi analiz etmek hatalı sonuçlar doğurur.
ANOVA İçin Kullanılan Yazılımlar
| Yazılım | Özellik | Uygunluk |
|---|---|---|
| Minitab | Kalite odaklı, kullanıcı dostu | Six Sigma ve endüstriyel uygulamalar |
| SPSS | Kapsamlı istatistik paketi | Akademik araştırmalar |
| R (aov, lm fonksiyonları) | Açık kaynaklı, esnek | İleri düzey analizler |
| Python (scipy, statsmodels) | Açık kaynaklı, programlanabilir | Veri bilimi projeleri |
| Excel (Data Analysis Toolpak) | Kolay erişim | Temel ANOVA hesaplamaları |
| JMP | Görselleştirme odaklı | DOE ve keşfedici analizler |
İlgili Konular
- 6 Sigma Nedir?
- MSA Nedir?
- Pareto Analizi Nedir?
- Kalite Kontrol Yöntemleri
- SPC Eğitimi
- Korelasyon Analizi Nedir?
- Ki-Kare Testi Nedir?
- Güven Aralığı Nedir?
Sık Sorulan Sorular
t-testi yalnızca iki grubun ortalamasını karşılaştırırken, ANOVA üç veya daha fazla grubun ortalamasını tek bir test ile karşılaştırır. İki grup için uygulanan ANOVA, bağımsız örneklem t-testi ile aynı sonucu verir (F = t-kare).
ANOVA sonucu anlamlı olduğunda (p < 0.05), en az bir grup çifti arasında anlamlı fark olduğu bilinir; ancak hangi gruplar arasında olduğu bilinmez. Bu nedenle Tukey HSD, Bonferroni veya Dunnett gibi post-hoc testlerden uygun olan uygulanmalıdır.
Büyük örneklemlerde (her grupta 30'dan fazla gözlem) ANOVA, Merkezi Limit Teoremi sayesinde normallikten sapmalara karşı oldukça dayanıklıdır (robust). Küçük örneklemlerde normallik ihlaline karşı non-parametrik alternatif olan Kruskal-Wallis testi tercih edilmelidir.
Tek yönlü ANOVA tek bir bağımsız değişkenin (faktörün) etkisini incelerken, çift yönlü ANOVA iki bağımsız değişkenin hem ana etkilerini hem de etkileşim etkisini aynı anda analiz eder. Çift yönlü ANOVA daha fazla bilgi sağlar ancak daha büyük örneklem gerektirir.
F değeri, gruplar arası varyans ile gruplar içi varyans oranını temsil eder. F değeri 1'e yakınsa gruplar arasında önemli bir fark yoktur. F değeri 1'den ne kadar büyükse, gruplar arası farkın rastgele değişkenlikten kaynaklanma olasılığı o kadar düşüktür.
ANOVA'da en yaygın etki büyüklüğü ölçüsü **eta-kare** değerdir. Eta-kare = SS Between / SS Total formülüyle hesaplanır ve bağımlı değişkendeki toplam varyasyonun yüzde kaçının bağımsız değişken tarafından açıklandığını gösterir. Genel olarak 0.01 küçük, 0.06 orta ve 0.14 büyük etki olarak yorumlanır.
Aynı deneklerden birden fazla ölçüm alındığında (örneğin tedavi öncesi, 1. ay, 3. ay ölçümleri) tekrarlı ölçümlü ANOVA (Repeated Measures ANOVA) kullanılır. Bu tasarımda gözlemler bağımsız olmadığı için standart ANOVA uygulanamaz.
Standart ANOVA raporlaması şu formatı takip eder: F(df Between, df Within) = F değeri, p = p değeri. Örneğin: "Gruplar arasında istatistiksel olarak anlamlı bir fark bulunmuştur, F(2, 12) = 24.54, p < 0.001, eta-kare = 0.80." Etki büyüklüğü ve post-hoc test sonuçları da mutlaka eklenmelidir.











