Güven aralığı
İstatistikte güven aralığı, belirli bir parametreyi tahmin etmenin özel bir şeklidir. Bu yöntemde, parametrenin gerçek (bilinmeyen) değerinin bu aralıkta olma olasılığı ile birlikte, parametre için tek bir değer yerine kabul edilebilir değerlerden oluşan bir aralık verilir. Güven aralığı bir örneklemden elde edilen gözlemlere dayanır ve bu nedenle örneklemden örnekleme farklılık gösterir. Parametrenin aralıkta olma olasılığına güven düzeyi denir. Çoğu zaman bu yüzde olarak verilir. Güven aralığı her zaman güven düzeyi ile birlikte verilir. İnsanlar "%95 güven aralığı" hakkında konuşabilir. Güven aralığının uç noktaları güven sınırları olarak adlandırılır. Belirli bir durumda belirli bir tahmin prosedürü için, güven seviyesi ne kadar yüksekse, güven aralığı da o kadar geniş olacaktır.
Bir güven aralığının hesaplanması genellikle tahmin sürecinin doğası hakkında varsayımlar gerektirir - öncelikle parametrik bir yöntemdir. Yaygın varsayımlardan biri, örneğin alındığı popülasyonun dağılımının normal olduğudur. Bu nedenle, aşağıda tartışıldığı gibi güven aralıkları sağlam istatistikler değildir, ancak sağlamlık eklemek için değişiklikler yapılabilir.
"Güven" teriminin anlamı
Güven terimi, yaygın kullanımda olduğu gibi istatistikte de benzer bir anlama sahiptir. Yaygın kullanımda, bir şey için %95 güven iddiası normalde sanal bir kesinliğe işaret eder. İstatistikte, %95 güven iddiası basitçe, araştırmacının çok sayıda olası aralıktan yirmi aralıktan on dokuzunun parametrenin gerçek değerini içerdiği tek bir olası aralık gördüğü anlamına gelir.
Pratik örnek
Bir makine bardaklara margarin dolduruyor. Örnek için makine, bardakların içeriği 250 g margarin olacak şekilde ayarlanmıştır. Makine her fincanı tam olarak 250 g ile dolduramayacağından, her bir fincana eklenen içerik bir miktar değişkenlik gösterir ve rastgele bir değişken X olarak kabul edilir. Bu değişkenliğin, 2,5 g standart sapma ile istenen ortalama 250 g etrafında normal olarak dağıldığı varsayılır. Makinenin yeterince kalibre edilip edilmediğini belirlemek için n = 25 fincan margarin örneği rastgele seçilir ve fincanlar tartılır. Margarin ağırlıkları X1 , ..., X25 , X'ten rastgele bir örneklemdir.
Beklenti μ hakkında bir izlenim edinmek için bir tahmin vermek yeterlidir. Uygun tahminci örneklem ortalamasıdır:
μ ^ = X ¯ = 1 n ∑ i = 1 n X i . {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}. }
Örnek, ortalama ile gerçek ağırlıkları x1 , ...,x25 gösterir:
x ¯ = 1 25 ∑ i = 1 25 x i = 250,2 gram . {\displaystyle {\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{grams}}. }
Eğer 25 fincanlık başka bir örnek alırsak, 250,4 veya 251,1 gram gibi değerler bulmayı kolayca bekleyebiliriz. Ancak 280 gramlık bir örneklem ortalama değeri, eğer fincanların ortalama içeriği gerçekten 250 grama yakınsa, son derece nadir olacaktır. Örneklem ortalamasının gözlenen değeri 250,2'nin etrafında, tüm popülasyon ortalamasının gerçekten bu aralıkta bir değer alması halinde, gözlenen verilerin özellikle olağandışı sayılmayacağı bir aralık vardır. Böyle bir aralığa μ parametresi için güven aralığı denir. Böyle bir aralığı nasıl hesaplarız? Aralığın uç noktaları örneklemden hesaplanmalıdır, bu nedenle bunlar istatistiktir, X1 , ..., X25 örnekleminin fonksiyonlarıdır ve dolayısıyla rastgele değişkenlerdir.
Bizim durumumuzda, normal dağılımlı bir örneklemden elde edilen örneklem ortalaması X'in de aynı beklenti μ ile normal dağılımlı olduğunu, ancak standart hatanın σ/√n = 0,5 (gram) olduğunu düşünerek uç noktaları belirleyebiliriz. Standardize ederek rastgele bir değişken elde ederiz
Z = X ¯ - μ σ / n = X ¯ - μ 0.5 {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}}
Tahmin edilecek μ parametresine bağlıdır, ancak μ parametresinden bağımsız standart normal dağılıma sahiptir. Bu nedenle, μ'dan bağımsız -z ve z sayılarını bulmak mümkündür; burada Z, ne kadar emin olmak istediğimizin bir ölçüsü olan 1 - α olasılığı ile arada yer alır. 1 - α = 0,95 olarak alıyoruz. O halde elimizde:
P ( - z ≤ Z ≤ z ) = 1 - α = 0,95. {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0.95.\,}
Z sayısı kümülatif dağılım fonksiyonundan gelir:
Φ ( z ) = P ( Z ≤ z ) = 1 - α 2 = 0.975 , z = Φ - 1 ( Φ ( z ) ) = Φ - 1 ( 0.975 ) = 1.96 , {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}
ve elde ederiz:
0,95 = 1 - α = P ( - z ≤ Z ≤ z ) = P ( - 1,96 ≤ X ¯ - μ σ / n ≤ 1,96 ) = P ( X ¯ - 1,96 σ n ≤ μ ≤ X ¯ + 1.96 σ n ) = P ( X ¯ - 1.96 × 0.5 ≤ μ ≤ X ¯ + 1.96 × 0.5 ) = P ( X ¯ - 0.98 ≤ μ ≤ X ¯ + 0.98 ) . {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}
Bu şu şekilde yorumlanabilir: 0.95 olasılıkla, stokastik uç noktalar arasında μ parametresini karşılayacağımız bir güven aralığı bulacağız
X ¯ - 0 . 98 {\displaystyle {\bar {X}}-0{.}98\,}
ve
X ¯ + 0.98. {\displaystyle {\bar {X}}+0.98.\,}
Bu, hesaplanan aralıkta μ parametresini karşılama olasılığının 0,95 olduğu anlamına gelmez. Ölçümler her tekrarlandığında, örneklemin ortalama X değeri için başka bir değer olacaktır. Vakaların %95'inde μ bu ortalamadan hesaplanan uç noktalar arasında olacak, ancak vakaların %5'inde olmayacaktır. Gerçek güven aralığı, ölçülen ağırlıkların formüle girilmesiyle hesaplanır. Bizim 0,95 güven aralığımız şöyle olur:
( x ¯ - 0.98 ; x ¯ + 0.98 ) = ( 250.2 - 0.98 ; 250.2 + 0.98 ) = ( 249.22 ; 251.18 ) . {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,}
İstenen μ değeri 250 sonuçlanan güven aralığı içinde olduğundan, makinenin yanlış kalibre edildiğine inanmak için bir neden yoktur.
Hesaplanan aralığın sabit uç noktaları vardır, burada μ arada olabilir (veya olmayabilir). Dolayısıyla bu olayın olasılığı ya 0 ya da 1'dir. Şunu söyleyemeyiz: "(1 - α) olasılıkla μ parametresi güven aralığında yer alır." Sadece 100(1 - α) tekrarlama ile μ'nün hesaplanan aralıkta olacağını biliriz. Ancak vakaların % 100α'sında böyle değildir. Ve ne yazık ki bunun hangi durumlarda gerçekleştiğini bilmiyoruz. Bu yüzden şöyle diyoruz: "% 100(1 - α) güven düzeyinde, μ güven aralığında yer alır. "
Sağdaki şekil, belirli bir popülasyon ortalaması μ için bir güven aralığının 50 gerçekleşmesini göstermektedir. Rastgele bir gerçekleşme seçersek, parametreyi içeren bir aralık seçmiş olma olasılığımız %95'tir; ancak şanssız olabilir ve yanlış olanı seçmiş olabiliriz. Bunu asla bilemeyiz; aralığımıza saplanıp kalırız.
Dikey çizgi segmentleri μ için bir güven aralığının 50 gerçekleşmesini temsil etmektedir.
Sorular ve Yanıtlar
S: İstatistikte güven aralığı nedir?
C: Güven aralığı, popülasyon ortalaması gibi bir parametreyi tahmin etmek için kullanılan ve parametre için tek bir değer yerine kabul edilebilir değerler aralığı veren özel bir aralıktır.
S: Neden tek bir değer yerine güven aralığı kullanılır?
C: Bir örnekleme dayalı olarak bir parametreyi tahmin etmenin belirsizliğini hesaba katmak ve parametrenin gerçek değerinin aralık içinde olma olasılığını vermek için tek bir değer yerine bir güven aralığı kullanılır.
S: Güven düzeyi nedir?
C: Güven düzeyi, tahmin edilen parametrenin güven aralığı içinde olma olasılığıdır ve genellikle yüzde olarak verilir (örneğin %95 güven aralığı).
S: Güven sınırları nedir?
C: Güven sınırları, tahmin edilen parametre için kabul edilebilir değerler aralığını tanımlayan bir güven aralığının son noktalarıdır.
S: Güven seviyesi güven aralığını nasıl etkiler?
C: Belirli bir tahmin prosedüründe, güven seviyesi ne kadar yüksekse, güven aralığı da o kadar geniş olacaktır.
S: Bir güven aralığını hesaplamak için hangi varsayımlar gereklidir?
C: Bir güven aralığının hesaplanması genellikle tahmin sürecinin doğası hakkında varsayımlar gerektirir, örneğin örneğin örneğin geldiği popülasyonun dağılımının normal olduğu varsayımı gibi.
S: Güven aralıkları sağlam istatistikler midir?
C: Güven aralıkları, aşağıda tartışıldığı gibi, sağlam istatistikler değildir, ancak sağlamlık eklemek için ayarlamalar yapılabilir.