İstatistikte beş rakamın özeti nedir?

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Tanımlayıcı istatistikler, bir veri setini az sayıda sayı veya verinin nasıl dağıtıldığını açıklamaya hizmet eden ölçülerle özetlememize olanak tanır. Verilerin merkezi eğilimini, dağılımını ve dağılım eğrilerinin şeklini tanımlamaya hizmet eden farklı ölçüler vardır ve bunların bir kısmı beş rakamlı özette bulunur.

Beş rakamın özeti nedir?

Yukarıdakilere dayanarak, beş sayının özeti, kümenin genliğini, dağılımını çok basit bir şekilde tanımlamaya izin veren bir veri kümesiyle ilgili beş ölçü veya istatistik kümesi olarak tanımlanabilir. Aynı zamanda merkezi eğiliminin bir ölçüsünü sağlar. Ek olarak, beş rakamlı özet grafiksel olarak da gösterilebilir, bu da bir veri setinin bu özelliklerinin görselleştirilmesini kolaylaştırırken diğer ilgili veri setleriyle kolayca karşılaştırılmasına olanak tanır.

Beş sayı nedir ve ne anlama gelir?

Beş rakamlı özet, bir dizi istatistiksel verinin minimum değeri, üç çeyrek ve maksimum değerinden oluşur. Çeyrekler, sıralı tüm veri kümesini aynı sayıda öğeye sahip dört alt gruba bölen veriler veya değerlerdir . Bu nedenle, 100 veriden oluşan bir kümemiz varsa, çeyrekler, kümeyi her biri 25 veriden oluşan 4 alt kümeye bölen veriler veya değerlerdir.

Çeyrekler, birinci, ikinci ve üçüncü çeyrekler gibi en düşükten en yükseğe doğru göründükleri sırayla adlandırılır. Ek olarak, büyük Q harfi ve ardından sıra konumlarını gösteren sayı ile temsil edilirler. Tanımı gereği, ikinci çeyrek Q2, verilerin ortancası veya orta noktası olarak da bilinir . Verilerin aritmetik ortalaması olan ortalama ile karıştırılmamalıdır.

Beş rakamlı özet, üç çeyreğe (Q1, Q2 ve Q3) ek olarak, küçükten büyüğe sıralanmış verilerin minimum değerini ve maksimum değeri de içerir. Başka bir deyişle, bu özetteki beş rakam şunlardır:

  • Minimum.– En düşükten en yükseğe doğru sıralanmış bir dizi istatistiksel verinin ilk değeridir. En düşük değerli veridir.
  • Q1 veya ilk çeyrek.– Veri setini bölen, %25’ini (veya dörtte birini) aşağıda ve diğer %75’i yukarıda bırakan veri veya değerdir.
  • Q2 veya ikinci çeyrek.– Veri setini iki eşit gruba bölen veri veya değerdir. Yani verinin %50’sini hem altında hem de üstünde bırakan değerdir, dolayısıyla verinin medyanını veya orta noktasını da temsil eder.
  • 3. Çeyrek veya üçüncü çeyrek.– Bu, verilerin %75’ini veya dörtte üçünü aşağıda ve diğer %25’i yukarıda bırakan veri veya değerdir.
  • Maximum.– Adından da anlaşılacağı üzere tüm veri serisinin en yüksek değerine sahip verisidir. Yani en düşükten en yükseğe doğru sıralandığında son veridir.

Beş sayı özetini yorumlarken, minimum ve maksimum değer arasındaki fark, veri serisinin genişliği olarak bilinen şeyi sağlar. Öte yandan, Interquartile Range (RIC) olarak adlandırılan üçüncü ve birinci çeyrekler arasındaki fark, merkezi verilerin %50’sini içeren değerler aralığını gösterdiği için verilerin ne kadar dağınık olduğunu bize gösterir.

İkinci çeyrek veya medyan ise serideki tüm verilerin değerini tek bir sayı ile temsil etmek için kullanılabilecek bir merkezi eğilim ölçüsüdür. Ortalama, birçok durumda merkezi eğilim ölçüsü olarak sıklıkla kullanılsa da, medyan uç değerlere (çok yüksek veya çok düşük) duyarlı olmama avantajını sunar.

Kutu çizimleri: beş sayı özetinin grafik gösterimi

Beş sayının bir özetini görselleştirmenin pratik bir yolu, kutu grafiği veya Kutu Grafiği olarak adlandırılan şeydir . Bu gösterim türünde, çeyrekler arası aralık (IQR), Q1’den Q3’e uzanan bir dikdörtgen veya kutu olarak temsil edilir ve Q2’de, yani medyanda bulunan ölçüm eksenine dik bir çizgi ile ikiye bölünür.

Son olarak, kutunun her iki tarafında minimumdan Q1’e ve Q3’ten maksimuma uzanan ölçüm eksenine paralel çizgiler çizilir, minimum ve maksimum soldan 1.5.RIC uzaklık ve sırasıyla Q1 ve Q3’ün sağında. Bu yanal çizgiler, kutunun bıyıkları olarak bilinen çizgilerdir. Q1 – 1.5.RIC ve Q3 + 1.5.RIC ile sınırlandırılan aralığın dışında veri varsa, kenarlar (bazen bıyık olarak da adlandırılır) bu aralığın içindeki kutudan en uzaktaki verilere uzanır ve geri kalanlar işaretlenir aykırı değerler olarak.

Bir veri dizisi için beş sayının özetinin hazırlanmasına örnek

Ardından, bir dizi istatistiksel veriden beş sayının bir özetinin detaylandırılması için prosedür adım adım sunulur. Ek olarak, bu özetin grafiksel olarak görselleştirilmesi için kutu grafiğinin nasıl oluşturulacağını açıklar.

Veriler, bir mağazanın kadın reyonunda 10 haftalık dönemde satılan ürün sayısına karşılık gelmektedir. Çalışmanın sonuçları aşağıda sunulmuştur:

Pazartesi Salı Çarşamba Perşembe Cuma Cumartesi Pazar
1. hafta 158 145 156 156 164 167 147
hafta 2 161 146 157 152 162 160 153
3. Hafta 152 150 157 155 164 166 152
4. hafta 150 149 153 162 169 162 149
5. hafta 157 152 154 155 168 161 155
6. hafta 157 145 160 164 164 168 149
7. hafta 160 152 151 152 168 163 145
8. hafta 157 152 155 156 162 169 155
9. hafta 160 148 157 150 164 170 154
10. hafta 158 146 163 158 165 169 150

Adım 1: Tüm verileri küçükten büyüğe doğru sıralayın ve onlara 1’den başlayarak bir dizin atayın.

Bu adımın sonucu aşağıda sunulmuştur:

dizin Değer dizin Değer dizin Değer dizin Değer
1 145 22 152 43 158 64 168
2 145 23 153 44 160 65 168
3 145 24 153 Dört beş 160 66 168
4 146 25 154 46 160 67 169
5 146 26 154 47 160 68 169
6 147 27 155 48 161 69 169
7 148 28 155 49 161 70 170
8 149 29 155 elli 162
9 149 30 155 51 162
10 149 31 155 52 162
on bir 150 32 156 53 162
12 150 33 156 54 163
13 150 3. 4 156 55 163
14 150 35 157 56 164
onbeş 151 36 157 57 164
16 152 37 157 58 164
17 152 38 157 59 164
18 152 39 157 60 164
19 152 40 157 61 165
yirmi 152 41 158 62 166
yirmi bir 152 42 158 63 167

Adım 2: Q1 ve Q3 çeyreklerini belirleyin

Q1, Q2 ve Q3 çeyreklerini belirlemek için, her bir çeyreğe karşılık gelen veriler için bir indeks hesaplayarak başlıyoruz. Formül aşağıdaki gibidir:

Beş Sayı Özeti

Beş Sayı Özeti

Beş Sayı Özeti

N , toplam veri sayısıdır. Bu hesaplama tamsayı olabilir veya olmayabilir, bu nedenle prosedür iki duruma ayrılır:

Durum 1: Tamsayı sonucu

Sonuç tamsayı ise ilgili çeyrek, indeksin karşılık geldiği verinin değeri olacaktır. Örneğin, Q1’in indeksi 10 veriyorsa, bu, Q1’in 10 numaralı verinin değeri olacağı anlamına gelir (bizim örneğimizde 149).

Durum 2: Ondalık sonuç

Dizin ondalık bir sayıysa, çeyrek tam olarak seride bulunan verilerin hiçbirine karşılık gelmeyecektir. Bu durumda, sonuç aşağı yuvarlanır ve aşağıdaki formül kullanılarak bu ve onu takip eden verilerden çeyreklik hesaplanır:

Beş Sayı Özeti

Burada d, dizinin ondalık kısmını temsil eder, x i, dizini aşağı yuvarlanmış veridir ve x i+1 , bir sonraki veri noktasıdır.

Örneğimizde, bu, üç çeyreğin endekslerini hesaplamanın sonucudur:

Beş Sayı Özeti

Beş Sayı Özeti

Beş Sayı Özeti

Her durumda sonuç bir ondalık sayıydı, bu nedenle şimdi her bir çeyreğin değerini belirlemek için 2. durumdaki formülü uyguluyoruz:

Beş Sayı Özeti

Beş Sayı Özeti

Beş Sayı Özeti

3. Adım: Beş sayıyı belirleyin

Artık verileri sıraladığımıza ve üç çeyreğin değerlerini de belirlediğimize göre, beş sayının özeti şöyledir:

Asgari: 145
S1: 152
Q2 veya Medyan: 157
S3: 162.25
Maksimum: 170

Adım 4: Kutu grafiğini oluşturun

RIC dışında kutu grafiğini oluşturmak için gereken her şeye zaten sahibiz. Önceki adımda elde edilen sonuca göre, Q3 ve Q1 arasındaki fark:

Beş Sayı Özeti

Aykırı değerler olup olmadığını belirlemek için, Q1 – 1,5 IQR ve Q3 + 1,5 IQR’yi hesaplar ve minimum ve maksimum ile karşılaştırırız:

Beş Sayı Özeti

Beş Sayı Özeti

Gördüğümüz gibi, minimum 140, 136.625’ten büyük olduğu için aykırı değer yok. Maksimum değer olan 170, 177.625’ten az olduğu için aykırı değerler de yoktur.

Aşağıdaki şekil, örneğe karşılık gelen kutu grafiğini oluşturmanın sonucunu gösterir:

Beş Sayı Özeti

Referanslar

İstatistiksel bir örneğin beş numaralı özeti nasıl oluşturulur ? (son). FaqSalex.info. https://faqsalex.info/educaci%C3%B3n/21361-c%C3%B3mo-reunir-a-un-resumen-de-cinco-n%C3%BAmeros-de-una.html

McAdams, D. (2009, 4 Mart). Beş sayının özeti. Life is a Story Problem.org. https://lifeisastoryproblem.tripod.com/en/f/fivenumbersummary.html

Serra, BR (2020, 22 Kasım). medyan _ Evren Formülleri. https://www.universoformulas.com/estadistica/descriptiva/mediana/#calculo

Serra, BR (2021, 4 Ağustos). çeyrekler _ Evren Formülleri. https://www.universoformulas.com/estadistica/descriptiva/cuartiles/#example

Zentica Global. (son). Brutalk – Python’da verileriniz için 5 numaralı özet nasıl hesaplanır ? Kaba konuşma. https://www.brutalk.com/en/news/brutalk-blog/view/how-to-calculate-the-summary-of-5-numbers-for-your-data-in-python-6047097da7d56

-Reklamcılık-

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados