Tabla de Contenidos
Tanımlayıcı istatistikler, bir veri setini az sayıda sayı veya verinin nasıl dağıtıldığını açıklamaya hizmet eden ölçülerle özetlememize olanak tanır. Verilerin merkezi eğilimini, dağılımını ve dağılım eğrilerinin şeklini tanımlamaya hizmet eden farklı ölçüler vardır ve bunların bir kısmı beş rakamlı özette bulunur.
Beş rakamın özeti nedir?
Yukarıdakilere dayanarak, beş sayının özeti, kümenin genliğini, dağılımını çok basit bir şekilde tanımlamaya izin veren bir veri kümesiyle ilgili beş ölçü veya istatistik kümesi olarak tanımlanabilir. Aynı zamanda merkezi eğiliminin bir ölçüsünü sağlar. Ek olarak, beş rakamlı özet grafiksel olarak da gösterilebilir, bu da bir veri setinin bu özelliklerinin görselleştirilmesini kolaylaştırırken diğer ilgili veri setleriyle kolayca karşılaştırılmasına olanak tanır.
Beş sayı nedir ve ne anlama gelir?
Beş rakamlı özet, bir dizi istatistiksel verinin minimum değeri, üç çeyrek ve maksimum değerinden oluşur. Çeyrekler, sıralı tüm veri kümesini aynı sayıda öğeye sahip dört alt gruba bölen veriler veya değerlerdir . Bu nedenle, 100 veriden oluşan bir kümemiz varsa, çeyrekler, kümeyi her biri 25 veriden oluşan 4 alt kümeye bölen veriler veya değerlerdir.
Çeyrekler, birinci, ikinci ve üçüncü çeyrekler gibi en düşükten en yükseğe doğru göründükleri sırayla adlandırılır. Ek olarak, büyük Q harfi ve ardından sıra konumlarını gösteren sayı ile temsil edilirler. Tanımı gereği, ikinci çeyrek Q2, verilerin ortancası veya orta noktası olarak da bilinir . Verilerin aritmetik ortalaması olan ortalama ile karıştırılmamalıdır.
Beş rakamlı özet, üç çeyreğe (Q1, Q2 ve Q3) ek olarak, küçükten büyüğe sıralanmış verilerin minimum değerini ve maksimum değeri de içerir. Başka bir deyişle, bu özetteki beş rakam şunlardır:
- Minimum.– En düşükten en yükseğe doğru sıralanmış bir dizi istatistiksel verinin ilk değeridir. En düşük değerli veridir.
- Q1 veya ilk çeyrek.– Veri setini bölen, %25’ini (veya dörtte birini) aşağıda ve diğer %75’i yukarıda bırakan veri veya değerdir.
- Q2 veya ikinci çeyrek.– Veri setini iki eşit gruba bölen veri veya değerdir. Yani verinin %50’sini hem altında hem de üstünde bırakan değerdir, dolayısıyla verinin medyanını veya orta noktasını da temsil eder.
- 3. Çeyrek veya üçüncü çeyrek.– Bu, verilerin %75’ini veya dörtte üçünü aşağıda ve diğer %25’i yukarıda bırakan veri veya değerdir.
- Maximum.– Adından da anlaşılacağı üzere tüm veri serisinin en yüksek değerine sahip verisidir. Yani en düşükten en yükseğe doğru sıralandığında son veridir.
Beş sayı özetini yorumlarken, minimum ve maksimum değer arasındaki fark, veri serisinin genişliği olarak bilinen şeyi sağlar. Öte yandan, Interquartile Range (RIC) olarak adlandırılan üçüncü ve birinci çeyrekler arasındaki fark, merkezi verilerin %50’sini içeren değerler aralığını gösterdiği için verilerin ne kadar dağınık olduğunu bize gösterir.
İkinci çeyrek veya medyan ise serideki tüm verilerin değerini tek bir sayı ile temsil etmek için kullanılabilecek bir merkezi eğilim ölçüsüdür. Ortalama, birçok durumda merkezi eğilim ölçüsü olarak sıklıkla kullanılsa da, medyan uç değerlere (çok yüksek veya çok düşük) duyarlı olmama avantajını sunar.
Kutu çizimleri: beş sayı özetinin grafik gösterimi
Beş sayının bir özetini görselleştirmenin pratik bir yolu, kutu grafiği veya Kutu Grafiği olarak adlandırılan şeydir . Bu gösterim türünde, çeyrekler arası aralık (IQR), Q1’den Q3’e uzanan bir dikdörtgen veya kutu olarak temsil edilir ve Q2’de, yani medyanda bulunan ölçüm eksenine dik bir çizgi ile ikiye bölünür.
Son olarak, kutunun her iki tarafında minimumdan Q1’e ve Q3’ten maksimuma uzanan ölçüm eksenine paralel çizgiler çizilir, minimum ve maksimum soldan 1.5.RIC uzaklık ve sırasıyla Q1 ve Q3’ün sağında. Bu yanal çizgiler, kutunun bıyıkları olarak bilinen çizgilerdir. Q1 – 1.5.RIC ve Q3 + 1.5.RIC ile sınırlandırılan aralığın dışında veri varsa, kenarlar (bazen bıyık olarak da adlandırılır) bu aralığın içindeki kutudan en uzaktaki verilere uzanır ve geri kalanlar işaretlenir aykırı değerler olarak.
Bir veri dizisi için beş sayının özetinin hazırlanmasına örnek
Ardından, bir dizi istatistiksel veriden beş sayının bir özetinin detaylandırılması için prosedür adım adım sunulur. Ek olarak, bu özetin grafiksel olarak görselleştirilmesi için kutu grafiğinin nasıl oluşturulacağını açıklar.
Veriler, bir mağazanın kadın reyonunda 10 haftalık dönemde satılan ürün sayısına karşılık gelmektedir. Çalışmanın sonuçları aşağıda sunulmuştur:
Pazartesi | Salı | Çarşamba | Perşembe | Cuma | Cumartesi | Pazar | |
1. hafta | 158 | 145 | 156 | 156 | 164 | 167 | 147 |
hafta 2 | 161 | 146 | 157 | 152 | 162 | 160 | 153 |
3. Hafta | 152 | 150 | 157 | 155 | 164 | 166 | 152 |
4. hafta | 150 | 149 | 153 | 162 | 169 | 162 | 149 |
5. hafta | 157 | 152 | 154 | 155 | 168 | 161 | 155 |
6. hafta | 157 | 145 | 160 | 164 | 164 | 168 | 149 |
7. hafta | 160 | 152 | 151 | 152 | 168 | 163 | 145 |
8. hafta | 157 | 152 | 155 | 156 | 162 | 169 | 155 |
9. hafta | 160 | 148 | 157 | 150 | 164 | 170 | 154 |
10. hafta | 158 | 146 | 163 | 158 | 165 | 169 | 150 |
Adım 1: Tüm verileri küçükten büyüğe doğru sıralayın ve onlara 1’den başlayarak bir dizin atayın.
Bu adımın sonucu aşağıda sunulmuştur:
dizin | Değer | dizin | Değer | dizin | Değer | dizin | Değer |
1 | 145 | 22 | 152 | 43 | 158 | 64 | 168 |
2 | 145 | 23 | 153 | 44 | 160 | 65 | 168 |
3 | 145 | 24 | 153 | Dört beş | 160 | 66 | 168 |
4 | 146 | 25 | 154 | 46 | 160 | 67 | 169 |
5 | 146 | 26 | 154 | 47 | 160 | 68 | 169 |
6 | 147 | 27 | 155 | 48 | 161 | 69 | 169 |
7 | 148 | 28 | 155 | 49 | 161 | 70 | 170 |
8 | 149 | 29 | 155 | elli | 162 | ||
9 | 149 | 30 | 155 | 51 | 162 | ||
10 | 149 | 31 | 155 | 52 | 162 | ||
on bir | 150 | 32 | 156 | 53 | 162 | ||
12 | 150 | 33 | 156 | 54 | 163 | ||
13 | 150 | 3. 4 | 156 | 55 | 163 | ||
14 | 150 | 35 | 157 | 56 | 164 | ||
onbeş | 151 | 36 | 157 | 57 | 164 | ||
16 | 152 | 37 | 157 | 58 | 164 | ||
17 | 152 | 38 | 157 | 59 | 164 | ||
18 | 152 | 39 | 157 | 60 | 164 | ||
19 | 152 | 40 | 157 | 61 | 165 | ||
yirmi | 152 | 41 | 158 | 62 | 166 | ||
yirmi bir | 152 | 42 | 158 | 63 | 167 |
Adım 2: Q1 ve Q3 çeyreklerini belirleyin
Q1, Q2 ve Q3 çeyreklerini belirlemek için, her bir çeyreğe karşılık gelen veriler için bir indeks hesaplayarak başlıyoruz. Formül aşağıdaki gibidir:
N , toplam veri sayısıdır. Bu hesaplama tamsayı olabilir veya olmayabilir, bu nedenle prosedür iki duruma ayrılır:
Durum 1: Tamsayı sonucu
Sonuç tamsayı ise ilgili çeyrek, indeksin karşılık geldiği verinin değeri olacaktır. Örneğin, Q1’in indeksi 10 veriyorsa, bu, Q1’in 10 numaralı verinin değeri olacağı anlamına gelir (bizim örneğimizde 149).
Durum 2: Ondalık sonuç
Dizin ondalık bir sayıysa, çeyrek tam olarak seride bulunan verilerin hiçbirine karşılık gelmeyecektir. Bu durumda, sonuç aşağı yuvarlanır ve aşağıdaki formül kullanılarak bu ve onu takip eden verilerden çeyreklik hesaplanır:
Burada d, dizinin ondalık kısmını temsil eder, x i, dizini aşağı yuvarlanmış veridir ve x i+1 , bir sonraki veri noktasıdır.
Örneğimizde, bu, üç çeyreğin endekslerini hesaplamanın sonucudur:
Her durumda sonuç bir ondalık sayıydı, bu nedenle şimdi her bir çeyreğin değerini belirlemek için 2. durumdaki formülü uyguluyoruz:
3. Adım: Beş sayıyı belirleyin
Artık verileri sıraladığımıza ve üç çeyreğin değerlerini de belirlediğimize göre, beş sayının özeti şöyledir:
Asgari: | 145 |
S1: | 152 |
Q2 veya Medyan: | 157 |
S3: | 162.25 |
Maksimum: | 170 |
Adım 4: Kutu grafiğini oluşturun
RIC dışında kutu grafiğini oluşturmak için gereken her şeye zaten sahibiz. Önceki adımda elde edilen sonuca göre, Q3 ve Q1 arasındaki fark:
Aykırı değerler olup olmadığını belirlemek için, Q1 – 1,5 IQR ve Q3 + 1,5 IQR’yi hesaplar ve minimum ve maksimum ile karşılaştırırız:
Gördüğümüz gibi, minimum 140, 136.625’ten büyük olduğu için aykırı değer yok. Maksimum değer olan 170, 177.625’ten az olduğu için aykırı değerler de yoktur.
Aşağıdaki şekil, örneğe karşılık gelen kutu grafiğini oluşturmanın sonucunu gösterir:
Referanslar
İstatistiksel bir örneğin beş numaralı özeti nasıl oluşturulur ? (son). FaqSalex.info. https://faqsalex.info/educaci%C3%B3n/21361-c%C3%B3mo-reunir-a-un-resumen-de-cinco-n%C3%BAmeros-de-una.html
McAdams, D. (2009, 4 Mart). Beş sayının özeti. Life is a Story Problem.org. https://lifeisastoryproblem.tripod.com/en/f/fivenumbersummary.html
Serra, BR (2020, 22 Kasım). medyan _ Evren Formülleri. https://www.universoformulas.com/estadistica/descriptiva/mediana/#calculo
Serra, BR (2021, 4 Ağustos). çeyrekler _ Evren Formülleri. https://www.universoformulas.com/estadistica/descriptiva/cuartiles/#example
Zentica Global. (son). Brutalk – Python’da verileriniz için 5 numaralı özet nasıl hesaplanır ? Kaba konuşma. https://www.brutalk.com/en/news/brutalk-blog/view/how-to-calculate-the-summary-of-5-numbers-for-your-data-in-python-6047097da7d56