Olasılık Dağılımları Nedir?
Bir üretim hattından her gün binlerce parça geliyor. Ölçüm yapıyorsunuz, veriler birikiyor. Ama bu veriler size ne anlatıyor? Ortalamanın etrafında mı toplanıyorlar? Sağa mı sola mı çarpık? Hata sayıları belirli bir kalıba mı uyuyor?
Olasılık dağılımı, bir rastgele değişkenin alabileceği tüm değerleri ve bu değerlerin gerçekleşme olasılıklarını tanımlayan matematiksel bir fonksiyondur. Daha basit bir ifadeyle: verinizin "şeklini" ve "davranışını" tanımlayan bir kalıptır.
Kalite mühendisliğinde, istatistiksel proses kontrolde (SPC), güvenilirlik analizinde ve hipotez testlerinde doğru dağılımı bilmek, doğru kararlar almak demektir. Yanlış dağılım varsayımıyla yapılan analiz, yanlış sonuç verir. Yanlış sonuç, yanlış karara ve maliyetli hatalara yol acar.
Bu rehberde tum temel olasilik dagilimlarini, kalite muhendisligindeki uygulamalarini ve veri setiniz icin dogru dagilimi nasil sececeginizi ogreneceksiniz.
Olasılık Dağılımı Neden Önemli?
Olasılık dağılımlarını bilmenin pratik karşılığı büyüktür:
- Proses yeterliliği hesaplamaları: Cpk/Ppk hesaplarken verinin normal dağıldığını varsayarsınız. Dağılmıyorsa sonuçlar yanıltıcıdır.
- Kontrol grafikleri: Kontrol diyagramlarının kontrol limitleri, alttaki dağılım varsayımına dayanır.
- Güvenilirlik analizi: Bir ürünün ne zaman arızalanacağını tahmin etmek için Weibull veya üstel dağılım kullanılır.
- Hipotez testleri: t-testi, ki-kare testi, F-testi gibi testlerin hepsi belirli dağılım varsayımlarına dayanır.
- Numune alma planları: Kabul örneklemesinde binom veya Poisson dağılımı temeldir.
- Six Sigma projeleri: Six Sigma metodolojisinin Measure ve Analyze aşamalarında dağılım analizi kritik bir adımdır.
Kısacası, kalite mühendisliğinde kullandığınız hemen hemen her istatistiksel aracın arka planında bir olasılık dağılımı vardır.
Kesikli ve Sürekli Dağılımlar
Olasılık dağılımları iki ana kategoriye ayrılır: kesikli (ayrık) ve sürekli dağılımlar. Ayrım, rastgele değişkenin aldığı değerlerin doğasına göre yapılır.
Kesikli dağılımlar: Rastgele değişken sayılabilir değerler alır. Hatalı parça sayısı, kusur sayısı, başarılı/başarısız deney sayısı gibi. Tam sayılar ile ifade edilir.
Sürekli dağılımlar: Rastgele değişken bir aralıktaki herhangi bir değeri alabilir. Ağırlık, uzunluk, sıcaklık, gerilim gibi ölçülebilir büyüklükler. Ondalıklı değerler alabilir.
Kesikli ve Sürekli Dağılımlar Karşılaştırma Tablosu
| Özellik | Kesikli Dağılımlar | Sürekli Dağılımlar |
|---|---|---|
| Değişken tipi | Sayılabilir (0, 1, 2, 3...) | Ölçülebilir (herhangi bir reel sayı) |
| Olasılık tanımı | P(X = x) > 0 olabilir | P(X = x) = 0 (nokta olasılığı sıfır) |
| Fonksiyon | Olasılık kütle fonksiyonu (PMF) | Olasılık yoğunluk fonksiyonu (PDF) |
| Toplam olasılık | Tüm değerlerin olasılıklarının toplamı = 1 | Eğri altındaki toplam alan = 1 |
| Örnekler | Binom, Poisson, hipergeometrik | Normal, üstel, Weibull, log-normal |
| Kalite uygulaması | Hatalı sayısı, kusur sayımı, geçti/kaldı | Ölçüm verileri, ömür testi, boyutsal analiz |
| Grafik gösterim | Çubuk grafik | Düzgün eğri |
Normal (Gauss) Dağılımı
Normal dağılım, istatistiğin en temel ve en yaygın kullanılan dağılımıdır. "Çan eğrisi" olarak da bilinir. Birçok doğal olayın ve üretim sürecinin verileri normal dağılıma uyar veya yaklaşır.
Normal Dağılımın Temel Özellikleri
- Ortalama (mu), medyan ve mod birbirine eşittir
- Ortalamaya göre simetriktir
- Eğri, iki uçta sonsuzluğa doğru uzanır ancak x-eksenine asla değmez
- Tam olarak iki parametre ile tanımlanır: ortalama (mu) ve standart sapma (sigma)
- Eğri altındaki toplam alan 1'e eşittir
68-95-99.7 Kuralı (Ampirik Kural)
Normal dağılımın en güçlü özelliği, standart sapma cinsinden verilerin ne kadarının nerede olduğunu kesin olarak bilmenizdir:
- mu +/- 1 sigma: Verilerin %68.27'si bu aralıkta
- mu +/- 2 sigma: Verilerin %95.45'i bu aralıkta
- mu +/- 3 sigma: Verilerin %99.73'ü bu aralıkta
Bu kural SPC'de kontrol limitlerinin temelini oluşturur. Kontrol grafiklerin +/- 3 sigma limitleri, proses kontrol altındayken ölçümlerin %99.73'ünün bu limitlerin içinde kalacağı anlamına gelir. Limitler dışındaki bir nokta, özel nedenli varyasyonun sinyalidir.
Z-Skoru ve Standart Normal Dağılım
Her normal dağılım, standart normal dağılıma (ortalama = 0, standart sapma = 1) dönüştürülebilir. Bu dönüşüm Z-skoru ile yapılır:
Z = (X - mu) / sigma
Z-skoru, bir gözlem değerinin ortalamadan kaç standart sapma uzakta olduğunu gösterir. Bu dönüşüm sayesinde farklı ortalamalara ve standart sapmalara sahip dağılımları karşılaştırabilirsiniz.
Pratik örnek: Bir CNC tezgahında üretilen mil çapı ortalaması 25.00 mm, standart sapma 0.02 mm olsun. Spesifikasyon limitleri 24.94 - 25.06 mm. Z-skoru hesabı:
- Üst limit Z = (25.06 - 25.00) / 0.02 = 3.0
- Alt limit Z = (24.94 - 25.00) / 0.02 = -3.0
Bu proses +/- 3 sigma seviyesinde, yani yaklaşık 2700 ppm (milyonda parça) hatalı üretim beklenir. Six Sigma hedefi ise +/- 6 sigma, yani 3.4 ppm hatalı uretimdir.
Merkezi Limit Teoremi (CLT)
Merkezi Limit Teoremi, istatistiğin belki de en önemli teoremidir. Şunu söylüyor:
Herhangi bir dağılıma sahip bir popülasyondan yeterince büyük örneklemler alındığında, örneklem ortalamalarının dağılımı yaklaşık olarak normal dağılıma yaklaşır.
Bu ne anlama geliyor? Verilerinizin kendisi normal dağılmasa bile, yeterli sayıda örneklem ortalaması aldığınızda bunlar normal dağılacaktır. Genel kabul görmüş kural: n >= 30 ise CLT çoğu dağılım için geçerlidir.
Merkezi Limit Teoremi, SPC'deki X-bar kontrol grafiklerinin çalışma prensibini açıklar. Bireysel ölçümler normal dağılmasa bile, alt grup ortalamaları normal dağılıma yaklaşır. Bu yüzden X-bar grafiklerinde normal dağılım tabanlı kontrol limitleri kullanılabilir.
Binom Dağılımı
Binom dağılımı, iki olası sonucu olan (başarılı/başarısız, geçti/kaldı, hatalı/hatasız) bağımsız deneylerin tekrarlanmasıyla elde edilen başarı sayısının dağılımıdır.
Binom Dağılımının Parametreleri
- n: Deneme sayısı (örneğin, incelenen parça sayısı)
- p: Her bir denemede "başarı" (veya hata) olasılığı
Binom Dağılımının Koşulları
- Sabit sayıda deneme (n)
- Her deneme bağımsız
- Her denemede iki olası sonuç (başarı veya başarısızlık)
- Başarı olasılığı (p) her denemede sabit
Kalite Kontrolde Binom Uygulaması
Bir partiden 50 adet numune alındığında (n = 50), her parçanın hatalı olma olasılığı p = 0.03 ise, 0, 1, 2, 3... hatalı parça bulma olasılıklarını binom dağılımı ile hesaplarsınız.
Pratik örnek: Bir tedarikçinin hatalı oranı %2 (p = 0.02). 100 parçalık partiden 20 numune alıyorsunuz. 2 veya daha fazla hatalı bulma olasılığı nedir? Binom dağılımı bu soruyu yanıtlar.
Kabul örneklemesi planlarında (AQL/RQL), p-kontrol grafiklerinde ve np-grafiklerinde binom dağılımı temel alınır. Kalite kontrol yöntemlerinde bu hesaplamalar sıklıkla kullanılır.
Poisson Dağılımı
Poisson dağılımı, belirli bir zaman diliminde veya alanda meydana gelen nadir olayların sayısını modellemek için kullanılır. Birim başına kusur sayısı, saat başına arıza sayısı gibi durumlar için idealdir.
Poisson Dağılımının Parametreleri
- lambda: Belirli bir birim aralığındaki ortalama olay sayısı (hem ortalama hem varyans)
Poisson ve Binom Farkı
Binom dağılımında sabit sayıda denemede "başarı sayısını" sayarsınız. Poisson dağılımında ise bir sürekli birimde (alan, zaman, uzunluk) "olay sayısını" sayarsınız. Ayrıca n buyuk ve p kucuk oldugunda binom dagilimi Poisson ile yaklaştırılabilir.
Kalite Kontrolde Poisson Uygulaması
Pratik örnek: Bir boya hattında metrekare başına ortalama 1.5 kusur (lambda = 1.5) bulunuyor. Bir panelde 4 veya daha fazla kusur bulma olasılığı nedir? Poisson dağılımı ile hesaplanır.
c-kontrol grafiklerinde (birim başına kusur sayısı) ve u-kontrol grafiklerinde (fırsat başına kusur oranı) Poisson dağılımı kullanılır. SPC uygulamalarında nitelik kontrol grafikleri bu dağılıma dayanır.
Üstel (Exponential) Dağılım
Üstel dağılım, ardışık olaylar arasındaki süreyi modelleyen sürekli bir dağılımdır. Güvenilirlik mühendisliğinde "arızalar arası süre" (MTBF) modellemesi için temel dağılımdır.
Üstel Dağılımın Temel Özelliği: Hafızasızlık
Üstel dağılımın en dikkat çekici özelliği hafızasızlık (memoryless) özelliğidir. Bir birim t saat çalıştıysa, bundan sonraki arıza olasılığı, yeni bir biriminkiyle aynıdır. Geçmiş, geleceği etkilemez.
Bu özellik ne zaman geçerlidir? Yalnızca sabit arıza oranına sahip sistemlerde. Yani bileşen ne yaşlanıyor ne de oturuyor. Elektronik bileşenler yararlı ömür döneminde genellikle bu davranışı gösterir.
Kalite/Güvenilirlikte Üstel Uygulaması
Pratik örnek: Bir elektronik kartın arızalar arası ortalama süresi (MTBF) 10.000 saat ise, kartın 5.000 saat arızasız çalışma olasılığı:
P(T > 5000) = e^(-5000/10000) = e^(-0.5) = 0.607 yani %60.7.
Bu hesap, yedek parça planlaması, garanti maliyeti tahmini ve bakım aralıkları belirlemede kullanılır.
Weibull Dağılımı
Weibull dağılımı, güvenilirlik mühendisliğinin en güçlü ve esnek dağılımıdır. Şekil parametresine (beta) bağlı olarak birçok farklı arıza davranışını modelleyebilir:
- beta < 1: Azalan arıza oranı (erken arızalar, infant mortality)
- beta = 1: Sabit arıza oranı (üstel dağılıma eşdeğer)
- beta > 1: Artan arıza oranı (aşınma, yaşlanma, yorulma arızaları)
Bu esneklik sayesinde Weibull dağılımı, küvet eğrisinin (bathtub curve) tüm bölgelerini modelleyebilir. Rulman ömrü, motor arızası, yapısal yorulma gibi uygulamalarda yaygın olarak kullanılır.
Weibull analizi, kalite kontrol yöntemlerinin güvenilirlik boyutunu oluşturur.
Size Uygun Eğitimi Bulun
Bireysel mi yoksa kurumsal mı eğitim arıyorsunuz?
Düzgün (Uniform) Dağılım
Düzgün dağılımda, belirli bir aralıktaki tüm değerler eşit olasılığa sahiptir. İki türü vardır:
- Kesikli düzgün dağılım: Zar atma (1-6 arası her sayı 1/6 olasılıkla)
- Sürekli düzgün dağılım: a ile b arasındaki herhangi bir değer eşit olasılıkla
Kalite mühendisliğinde düzgün dağılım genellikle belirsizlik analizinde, Monte Carlo simülasyonlarında ve "en kötü durum" senaryolarında kullanılır. Bir tolerans aralığında parça boyutunun nerede olacağını bilmiyorsanız, düzgün dağılım varsayımı kullanılabilir.
Log-Normal Dağılım
Log-normal dağılım, logaritması alındığında normal dağılıma uyan veriler için kullanılır. Sağa çarpık dağılımlarda oldukça yaygındır.
Ne Zaman Log-Normal Dağılım?
- Veriler sadece pozitif değer alıyorsa
- Dağılım sağa çarpık ise (sağ kuyruk uzun)
- Verilerin logaritması alındığında simetrik hale geliyorsa
Kalite Uygulamaları
- Tamir süreleri: Çoğu tamir kısa sürer, bazıları çok uzun. Sağa çarpık.
- Partikül boyutu dağılımı: Temiz oda sınıflandırmasında kullanılır.
- Yorulma ömrü verileri: Bazı malzeme yorulma verileri log-normal dağılır.
- Finansal veriler: Proses maliyet analizlerinde.
Cpk/Ppk hesaplarken veriniz sağa çarpıksa, normal dağılım varsayımıyla yanlış sonuçlar elde edersiniz. Bu durumda log-normal dönüşüm veya Johnson dönüşümü uygulanmalıdır.
Hipotez Testlerinde Kullanılan Dağılımlar
Bazı dağılımlar doğrudan veri modellemek için değil, hipotez testlerinin test istatistiklerini değerlendirmek için kullanılır.
Ki-Kare Dağılımı
Varyans testleri, uyum iyiliği testleri ve bağımsızlık testlerinde kullanılır. Serbestlik derecesine bağlı olarak şekli değişir. Her zaman pozitiftir ve sağa çarpıktır.
t-Dağılımı (Student t)
Küçük örneklem durumlarında (genellikle n < 30) ortalama testleri için kullanılır. Normal dağılıma benzer ama kuyrukları daha kalındır. Örneklem büyüklüğü arttıkça normal dağılıma yaklaşır.
F-Dağılımı
İki popülasyonun varyanslarını karşılaştırmak ve deney tasarımında (DoE) ANOVA analizlerinde kullanılır. Her zaman pozitiftir, sağa çarpıktır ve iki farklı serbestlik derecesi parametresine sahiptir.
Tüm Dağılımların Kapsamlı Karşılaştırma Tablosu
| Dağılım | Tip | Parametreler | Şekil | Kalite/Endüstri Uygulaması |
|---|---|---|---|---|
| Normal | Sürekli | mu, sigma | Simetrik, çan eğrisi | Boyutsal analiz, SPC, proses yeterliliği |
| Binom | Kesikli | n, p | Simetrik (p=0.5) veya çarpık | Geçti/kaldı muayenesi, p/np grafikleri |
| Poisson | Kesikli | lambda | Sağa çarpık (kucuk lambda) | Kusur sayımı, c/u grafikleri |
| Üstel | Sürekli | lambda | Sağa çarpık, azalan | Arızalar arası süre, MTBF (sabit arıza oranı) |
| Weibull | Sürekli | beta, eta | Esnektir (beta'ya bağlı) | Güvenilirlik analizi, ömür testi, arıza tahmini |
| Log-Normal | Sürekli | mu, sigma (log) | Sağa çarpık | Tamir süreleri, yorulma ömrü, partikül boyutu |
| Düzgün | Her ikisi | a, b | Düz (dikdörtgen) | Belirsizlik analizi, Monte Carlo simülasyonu |
| Ki-Kare | Sürekli | k (s.d.) | Sağa çarpık | Varyans testi, uyum iyiliği testi |
| t | Sürekli | k (s.d.) | Simetrik, kalın kuyruk | Küçük örneklem ortalama testi |
| F | Sürekli | d1, d2 (s.d.) | Sağa çarpık | ANOVA, varyans karşılaştırma |
Dağılım Seçimi: Verinize Uygun Dağılımı Nasıl Belirlersiniz?
Doğru dağılımı seçmek, doğru analiz sonucu almanın ön koşuludur. Aşağıdaki adımlar size rehberlik edecektir:
Adım 1: Veri Tipini Belirleyin
İlk soru: Veriniz sayma verisi mi (kesikli), yoksa ölçüm verisi mi (sürekli)?
- Kusur sayısı, hatalı parça adedi gibi -> Kesikli (Binom, Poisson)
- Ağırlık, uzunluk, sıcaklık, süre gibi -> Sürekli (Normal, Weibull, Log-normal, Üstel)
Adım 2: Veri Davranışını Gözlemleyin
- Histogram çizin: Simetrik mi? Çarpık mı? Kaç tepe noktası var?
- Negatif değer var mı? (Üstel, Weibull, Log-normal yalnızca pozitif)
- Veri sınırlandırılmış mı? (Düzgün dağılım, belirli aralıkta)
Adım 3: Bağlamı Değerlendirin
- Arıza süresi verisi -> Weibull veya Üstel
- İki sonuçlu (geçti/kaldı) veri -> Binom
- Nadir olay sayısı -> Poisson
- Ölçüm verisi, simetrik -> Normal
- Ölçüm verisi, sağa çarpık -> Log-Normal
Dağılım Seçim Karar Tablosu
| Veri Türü | Veri Davranışı | Bağlam | Önerilen Dağılım |
|---|---|---|---|
| Kesikli | İki sonuç (evet/hayır) | Hatalı/hatasız muayene | Binom |
| Kesikli | Sayma (olay adedi) | Birim başına kusur | Poisson |
| Sürekli | Simetrik, çan eğrisi | Boyutsal ölçüm | Normal |
| Sürekli | Sağa çarpık, pozitif | Tamir süresi, maliyet | Log-Normal |
| Sürekli | Sağa çarpık, pozitif | Arızalar arası süre | Üstel (sabit oran) |
| Sürekli | Değişken şekil | Ömür testi, güvenilirlik | Weibull |
| Sürekli | Tüm değerler eşit | Belirsizlik, simülasyon | Düzgün |
Normallik Testleri
Birçok istatistiksel yöntem (t-testi, ANOVA, Cpk hesaplamaları, kontrol grafikleri) verinin normal dağıldığını varsayar. Bu varsayımın doğruluğunu normallik testleriyle kontrol edersiniz.
Shapiro-Wilk Testi
Küçük ve orta büyüklükteki örneklemler (n < 5000) için en güçlü normallik testidir. W istatistiği 0 ile 1 arasında değer alır; 1'e ne kadar yakınsa veriler o kadar normal dağılıma uyar.
- H0: Veri normal dağılıma uyar.
- H1: Veri normal dağılıma uymaz.
- p > 0.05 ise: H0 reddedilemez, normallik varsayımı kabul edilir.
Anderson-Darling Testi
Shapiro-Wilk'e alternatif, özellikle kuyruk bölgelerine daha duyarlı bir testtir. Minitab gibi istatistik yazılımlarında yaygın olarak bulunur. AD istatistiği küçükse ve p-değeri yüksekse normallik kabul edilir.
Normal Olasılık Grafiği (Normal Probability Plot)
Görsel bir yöntemdir. Veriler normal dağılıma uyuyorsa, noktalar yaklaşık bir doğru üzerinde sıralanır. Doğrudan sapan noktalar, normallikten sapmanın nerede olduğunu gösterir (kuyruklar, merkez).
Pratik ipucu: Tek bir teste güvenmeyin. Hem sayısal testi (Shapiro-Wilk veya Anderson-Darling) hem de normal olasılık grafiğini birlikte değerlendirin. Özellikle büyük örneklemlerde (n > 1000) sayısal testler çok hassaslaşır ve küçük sapmaları bile istatistiksel olarak anlamlı bulabilir. Bu durumda grafiksel değerlendirme daha gerçekçi bir yargı sağlar.
Dağılım Uydurma (Distribution Fitting)
Verilerinize en uygun dağılımı bulmak için dağılım uydurma (distribution fitting) yaparsınız. Temel yaklaşım:
- Aday dağılımları belirleyin: Veri tipine ve bağlama göre 2-4 aday dağılım seçin.
- Parametre tahmini yapın: En çok olabilirlik (Maximum Likelihood) yöntemiyle her dağılımın parametrelerini tahmin edin.
- Uyum iyiliğini değerlendirin: Anderson-Darling, Kolmogorov-Smirnov veya Ki-Kare uyum iyiliği testi ile karşılaştırın.
- Görsel kontrol: Histogram üzerine dağılım eğrilerini çizdirin; olasılık grafiğini inceleyin.
- En iyi dağılımı seçin: En düşük AD istatistiği ve en yüksek p-değerine sahip dağılım genellikle en iyi seçimdir.
Minitab'da "Individual Distribution Identification" aracı, birden fazla dağılımı aynı anda test eder ve karşılaştırma tablosu sunar. MSA (Ölçüm Sistemi Analizi) yapılmış güvenilir verilerle çalışmanız, dağılım uydurma sonuçlarının doğruluğu için kritik önem taşır.
Dağılımların Pratik Özet Tablosu
| Soru | Yanıt | Kullanılacak Dağılım |
|---|---|---|
| 50 parçadan kaçı hatalı? | Hatalı parça sayısı | Binom |
| Bir metrekarede kaç kusur var? | Kusur adedi | Poisson |
| Mil çapı ne kadar? | Ölçüm değeri (mm) | Normal |
| Motor ne zaman arızalanır? | Arıza süresine kadar süre | Weibull |
| Arızalar arası ne kadar süre geçer? | İki arıza arası süre | Üstel |
| Tamir ne kadar sürer? | Tamir süresi (sağa çarpık) | Log-Normal |
| Tolerans aralığında nerede? | Eşit olasılıklı konum | Düzgün |
| Varyans farklı mı? | Hipotez testi istatistiği | Ki-Kare, F |
| Ortalama farklı mı? (n kucuk) | Hipotez testi istatistiği | t |
proses yeterliliği hesabı yanıltıcı sonuçlar verir. Normallik varsayımı sağlanmadan uygulanan hipotez testi güvenilir değildir. Kontrol grafiklerinin anlamlı olması, alttaki dağılım varsayımının doğruluğuna bağlıdır.
Bu rehberde ele alınan dağılımları ve seçim kriterlerini içselleştirdiğinizde, istatistiksel analizleriniz daha güvenilir ve kararlarınız daha sağlam olacaktır. Kalite mühendisliği, veriye dayalı karar alma sanatıdır ve bu sanatın alfabesi olasılık dağılımlarıdır.
Sık Sorulan Sorular
Olasılık dağılımı, bir rastgele olayın farklı sonuçlarının ne kadar olası olduğunu gösteren matematiksel bir modeldir. Bir zar attığınızda her yüzün gelme olasılığının 1/6 olması, düzgün kesikli bir dağılımdır. Üretimde ölçüm verilerinin çoğunun ortalamaya yakın, azının uç değerlerde olması ise normal dağılıma örnektir. Kısacası dağılım, verinizin "şekil haritası" gibidir.
Normal dağılım birkaç nedenle merkezi bir konumdadır. Birincisi, doğadaki ve endüstrideki birçok ölçüm verisi doğal olarak normal dağılıma uyar. İkincisi, Merkezi Limit Teoremi sayesinde örneklem ortalamaları orijinal dağılımdan bağımsız olarak normale yaklaşır. Üçüncüsü, [SPC](/blog/spc-nedir), [Cpk/Ppk](/blog/cpk-ppk-nedir), [hipotez testleri](/blog/hipotez-testi-nedir) ve birçok istatistiksel aracın temelinde normal dağılım varsayımı yatar.
Binom dağılımında sabit sayıda denemede (n) başarı sayısını sayarsınız. Her denemenin iki sonucu vardır (hatalı/hatasız) ve başarı olasılığı (p) sabittir. Poisson dağılımında ise bir birim alanda, zamanda veya hacimde meydana gelen olay sayısını sayarsınız. Kalite kontrolde binom: "50 parçadan kaçı hatalı?" sorusu; Poisson: "bir metrekare yüzeyde kaç kusur var?" sorusudur.
Birkaç seçeneğiniz var. Öncelikle veriye uygun alternatif bir dağılım uydurabilirsiniz (Weibull, Log-Normal, Üstel vb.). İkinci olarak veri dönüşümü (Box-Cox, Johnson) uygulayarak verinin normal dağılıma yaklaşmasını sağlayabilirsiniz. Üçüncü olarak parametrik olmayan yöntemler (non-parametric methods) kullanabilirsiniz. Dağılım varsayımı gerektirmeyen testler ve yöntemler de mevcuttur.
Weibull dağılımı, güvenilirlik ve ömür testi verilerinde birincil tercihtir. Şekil parametresi (beta) sayesinde artan arıza oranını (aşınma, yaşlanma), azalan arıza oranını (erken arıza) ve sabit arıza oranını tek bir dağılım çatısı altında modelleyebilir. Rulman ömrü, motor arızası, yorulma testi, garanti analizi gibi alanlarda yaygın olarak kullanılır.
Normallik testlerinde (Shapiro-Wilk, Anderson-Darling) sıfır hipotezi (H0) verilerin normal dağılıma uyduğunu ifade eder. p-değeri 0.05'ten büyükse, normallik varsayımını reddetmek için yeterli kanıt yoktur, yani verinizi normal kabul edebilirsiniz. p-değeri 0.05'ten küçükse, veriniz normal dağılıma uymuyor demektir ve alternatif bir dağılım aramanız gerekir.
Merkezi Limit Teoremi, örneklem ortalamalarıyla çalışmanızı mümkün kılar. Verileriniz normal dağılmasa bile yeterli büyüklükte alt gruplar alarak ortalamaların dağılımını normal kabul edebilirsiniz. Bu, [SPC'deki](/blog/spc-nedir) X-bar kontrol grafiklerinin, güven aralıklarının ve birçok hipotez testinin çalışmasını sağlayan temel mekanizmadır.
En sık kullanılan dağılımlar: **Normal dağılım** (boyutsal analiz, SPC, proses yeterliliği), **Binom** (geçti/kaldı muayenesi), **Poisson** (kusur sayımı), **Weibull** (güvenilirlik analizi) ve **Üstel** (sabit arıza oranlı sistemler). [Six Sigma projelerinde](/blog/six-sigma-nedir) ve [DoE çalışmalarında](/blog/doe-nedir) ise t, F ve Ki-kare dağılımları hipotez testleri için sıklıkla kullanılır.











