Spearman'ın sıra korelasyon katsayısı,
Matematik ve istatistikte, Spearman'ın sıra korelasyon katsayısı, adını yapımcısı Charles Spearman'dan alan bir korelasyon ölçüsüdür. Kısaca Yunanca rho harfi ( ρ {\displaystyle \rho } ) veya bazen r s {\displaystyle r_{s}} şeklinde yazılır. . İki veri kümesinin ne kadar yakından bağlantılı olduğunu gösteren bir sayıdır. Yalnızca en yüksekten en düşüğe gibi sıraya konulabilen veriler için kullanılabilir.
r s {\displaystyle r_{s}} için genel formül ρ = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle \rho =1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}} şeklindedir.
Örneğin, farklı bilgisayarların ne kadar pahalı olduğuna ve bilgisayarların ne kadar hızlı olduğuna dair verileriniz varsa, r s {\displaystyle r_{s}} kullanarak bunların bağlantılı olup olmadığını ve ne kadar yakından bağlantılı olduklarını görebilirsiniz. .
Üzerinde çalışıyorum
Birinci adım
r s {\displaystyle r_{s}} hesaplamak için öncelikle her bir veri parçasını sıralamanız gerekir. Bilgisayarlara ve hızlarına girişteki örneği kullanacağız.
Yani, en düşük fiyata sahip bilgisayar 1. sırada olacaktır. Ondan daha yüksek olan 2. sırada olacaktır. Sonra, hepsi sıralanana kadar devam eder. Bunu her iki veri kümesi için de yapmanız gerekir.
PC | Fiyat ($) | R a n k 1 {\displaystyle Rank_{1}} | Hız (GHz) | R a n k 2 {\displaystyle Rank_{2}} |
A | 200 | 1 | 1.80 | 2 |
B | 275 | 2 | 1.60 | 1 |
C | 300 | 3 | 2.20 | 4 |
D | 350 | 4 | 2.10 | 3 |
E | 600 | 5 | 4.00 | 5 |
İkinci adım
Ardından, iki rütbe arasındaki farkı bulmamız gerekiyor. Ardından, farkı kendisiyle çarparsınız, buna kare alma denir. Fark d {\displaystyle d} olarak adlandırılır ve d {\displaystyle d} 'nin karesini aldığınızda elde ettiğiniz sayıya d 2 {\displaystyle d^{2}} denir. .
R a n k 1 {\displaystyle Rank_{1}} | R a n k 2 {\displaystyle Rank_{2}} | d {\displaystyle d} | d 2 {\displaystyle d^{2}} |
1 | 2 | -1 | 1 |
2 | 1 | 1 | 1 |
3 | 4 | -1 | 1 |
4 | 3 | 1 | 1 |
5 | 5 | 0 | 0 |
Üçüncü adım
Elimizde ne kadar veri olduğunu sayın. Bu verilerin 1'den 5'e kadar sıraları vardır, yani 5 adet verimiz var. Bu sayıya n {\displaystyle n} denir.
Dördüncü adım
Son olarak, şimdiye kadar çalıştığımız her şeyi şu formülde kullanın: r s = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle r_{s}=1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}} .
∑ d 2 {\displaystyle \sum d^{2}} d 2 {\displaystyle d^{2}} sütununda bulunan tüm sayıların toplamını aldığımız anlamına gelir. . Bunun nedeni ∑ {\displaystyle \sum } toplam anlamına gelmesidir.
Yani, ∑ d 2 {\displaystyle \sum d^{2}} 1 + 1 + 1 + 1 {\displaystyle 1+1+1+1} yani 4. Formül bunu 6 ile çarpın diyor, bu da 24 eder.
n ( n 2 - 1 ) {\displaystyle n(n^{2}-1)} 5 × ( 25 - 1 ) {\displaystyle 5\times (25-1)} olup 120'dir.
Dolayısıyla, r s'yi bulmak için {\displaystyle r_{s}} basitçe 1 - 24 120 = 0,8 {\displaystyle 1-{\cfrac {24}{120}}=0,8} yaparız.
Dolayısıyla, Spearman'ın sıra korelasyon katsayısı bu veri seti için 0,8'dir.
Rakamlar ne anlama geliyor
r s {\displaystyle r_{s}} her zaman -1 ile 1 arasında bir cevap verir. Aradaki sayılar bir ölçek gibidir; -1 çok güçlü bir bağlantıdır, 0 bağlantı yoktur ve 1 de çok güçlü bir bağlantıdır. 1 ile -1 arasındaki fark, 1'in pozitif bir korelasyon, -1'in ise negatif bir korelasyon olmasıdır. r s {\displaystyle r_{s}} değeri -1 olan bir veri grafiği, çizgi ve noktaların sol üstten sağ alta doğru gitmesi dışında gösterilen grafik gibi görünecektir.
Örneğin, yukarıda yaptığımız veriler için r s {\displaystyle r_{s}} 0,8 idi. Yani bu, pozitif bir korelasyon olduğu anlamına gelir. Bu değer 1'e yakın olduğu için, iki veri seti arasındaki bağlantının güçlü olduğu anlamına gelir. Dolayısıyla, bu iki veri setinin bağlantılı olduğunu ve birlikte yükseldiğini söyleyebiliriz. Eğer -0,8 olsaydı, bunun bağlantılı olduğunu ve biri yükseldikçe diğerinin düştüğünü söyleyebilirdik.
Eğer iki sayı aynı ise
Bazen, verileri sıralarken, aynı olan iki veya daha fazla sayı vardır. Bu durum r s'de gerçekleştiğinde {\displaystyle r_{s}} aynı olan sıraların ortalamasını veya ortalamasını alırız. Bunlara bağlı sıralar denir. Bunu yapmak için, bağlı sayıları bağlı değilmiş gibi sıralarız. Ardından, sahip olabilecekleri tüm sıraları toplar ve kaç tane olduklarına böleriz. Örneğin, farklı kişilerin bir heceleme testinde ne kadar başarılı olduklarını sıraladığımızı varsayalım.
Test puanı | Rütbe | Sıra (bağlı) |
4 | 1 | 1 |
6 | 2 | 2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}}=3} |
6 | 3 | 2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}}=3} |
6 | 4 | 2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}}=3} |
8 | 5 | 5 + 6 2 = 5,5 {\displaystyle {\tfrac {5+6}{2}}=5,5} |
8 | 6 | 5 + 6 2 = 5,5 {\displaystyle {\tfrac {5+6}{2}}=5,5} |
Bu sayılar normal rütbelerle tamamen aynı şekilde kullanılır.
İlgili sayfalar
Sorular ve Yanıtlar
S: Spearman'ın sıra korelasyon katsayısı nedir?
C: Spearman'ın sıra korelasyon katsayısı, iki veri setinin ne kadar yakından bağlantılı olduğunu gösteren bir korelasyon ölçüsüdür. Yalnızca en yüksekten en düşüğe doğru sıralanabilen veriler için kullanılabilir.
S: Spearman'ın sıra korelasyon katsayısını kim yarattı?
C: Spearman'ın sıra korelasyon katsayısını Charles Spearman yaratmıştır.
S: Spearman'ın sıra korelasyon katsayısı için genel formül nasıl yazılır?
C: Spearman'ın sıra korelasyon katsayısı için genel formül ρ = 1 - 6∑d2/n(n2-1) olarak yazılır.
S: Spearman'ın sıra korelasyon katsayısını ne zaman kullanmalısınız?
C: Spearman'ın sıra korelasyon katsayısını, iki veri setinin ne kadar yakından bağlantılı olduğunu ve bağlantılı olup olmadıklarını görmek istediğinizde kullanmalısınız.
S: Ne tür verilerle çalışır?
C: En yüksekten en düşüğe gibi sıralanabilen her türlü veriyle çalışır.
S: Bu hesaplamayı nerede kullanacağınıza dair bir örnek verebilir misiniz?
C: Bu ölçütü kullanabileceğiniz bir örnek, farklı bilgisayarların ne kadar pahalı olduğuna dair verileriniz ve bilgisayarların ne kadar hızlı olduğuna dair verileriniz varsa, bunların bağlantılı olup olmadığını ve r_s kullanarak ne kadar yakından bağlantılı olduklarını görebilirsiniz.