Perbedaan antara standar deviasi populasi dan sampel

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Dalam statistik deskriptif ada serangkaian tindakan yang memungkinkan kita mengamati berbagai aspek umum dari data suatu populasi. Beberapa digunakan untuk mengukur kecenderungan sentral dari data, sementara yang lain berusaha untuk memberikan gambaran tentang variabilitas atau penyebaran data, yaitu cara data didistribusikan di sekitar kecenderungan sentral tersebut.

Dua ukuran penting variabilitas atau dispersi adalah varians dan standar deviasi. Kedua ukuran ini terkait erat satu sama lain, namun ada dua versi varians dan dua versi standar deviasi yang sesuai, yaitu populasi dan sampel.

Populasi vs Sampel Ringkasan Statistik

Perlu dicatat fakta yang sangat penting dan bahwa, dalam statistik, umumnya ada dua versi dari masing-masing ukuran yang meringkas perilaku serangkaian data dan yang digunakan dalam konteks yang berbeda.

Untuk memulainya, kita harus membedakan antara data dari populasi (atau data populasi) dan data dari subset dari populasi tersebut, yang disebut sampel. Meskipun data populasi dan data sampel secara matematis tidak dapat dibedakan, namun secara konseptual keduanya sangat berbeda.

sensus penduduk

Data populasi adalah data yang diperoleh melalui sensus statistik, yaitu mengukur atau menganalisis setiap elemen atau individu yang membentuk populasi (asalkan berhingga tentunya). Ketika kita menghitung ukuran tendensi sentral atau dispersi untuk data populasi, kita memperoleh ukuran yang meringkas perilaku umum populasi, yang kita sebut parameter populasi dan yang merupakan nilai tetap untuk populasi (yaitu, populasi hanya memiliki satu rata-rata). , satu mode, satu standar deviasi, dll. pada waktu tertentu). Dalam hal ini, kami menggunakan statistik deskriptif .

Contoh

Di sisi lain, dalam banyak situasi berbeda kami melakukan proses pengambilan sampel untuk menganalisis hanya beberapa elemen populasi, sehingga diperoleh data sampel. Dalam kasus ini, kami juga dapat menggunakan alat statistik deskriptif untuk mengamati perilaku umum dari data ini, namun sebenarnya kami tidak melakukan statistik deskriptif pada populasi, hanya pada sampel.

Ringkasan numerik dari sampel bukanlah parameter, tetapi disebut statistik (walaupun beberapa juga menyebutnya statistik). Tidak seperti parameter, statistik bervariasi dari satu sampel ke sampel lainnya , meskipun sampel diambil dari populasi yang sama. Hal ini karena, ketika memilih subset dari populasi, terdapat banyak kemungkinan kombinasi elemen yang dapat membentuk sampel. Oleh karena itu, pada umumnya sampel terdiri dari subjek, individu atau elemen yang berbeda sehingga menimbulkan statistik yang berbeda.

Tujuan akhir penghitungan statistik ini pada sampel adalah untuk dapat menggunakannya sebagai penaksir parameter populasi masing-masing. Proses menyimpulkan atau memperkirakan perilaku data populasi dari data sampel inilah yang menjadi tanggung jawab statistik inferensial . Ini membuat varian populasi dan sampel serta standar deviasi pada dasarnya berbeda.

Tapi apa sebenarnya varians dan standar deviasi?

Apa variansnya?

Varians adalah ukuran dispersi dari rata-rata kumpulan data. Ini didefinisikan sebagai rata-rata deviasi kuadrat dari semua data dari rata-rata. Menjadi rata-rata perbedaan kuadrat, itu selalu merupakan kuantitas positif.

Berapa standar deviasinya?

Di sisi lain, standar deviasi hanyalah akar kuadrat positif dari varians. Ini juga mengukur dispersi di sekitar rata-rata, hanya saja hal itu dilakukan dalam satuan data dan rata-rata yang sama. Ini membuatnya lebih mudah untuk dipahami dan ditafsirkan daripada varians.

Karena standar deviasi dihitung sebagai akar kuadrat dari varians, tidak masuk akal untuk membicarakan populasi dan standar deviasi sampel tanpa membicarakan populasi dan varians sampel.

Perbedaan yang paling penting antara ukuran umum dispersi di sekitar rata-rata ini akan dijelaskan secara rinci di bagian berikut.

Perbedaan 1: Standar deviasi dan varian populasi dan sampel diwakili oleh simbol yang berbeda

Perbedaan pertama yang perlu dipertimbangkan ketika membandingkan populasi dan sampel varians dan standar deviasi populasi dan sampel adalah simbol yang digunakan untuk mewakili mereka. Dalam statistik, ringkasan atau parameter numerik populasi biasanya direpresentasikan menggunakan huruf Yunani , sedangkan sampel atau versi statistik direpresentasikan dengan huruf yang setara dari alfabet Latin .

Dalam pengertian ini, varian dan deviasi standar populasi keduanya terkait dengan sigma huruf Yunani huruf kecil sedangkan versi sampel diwakili oleh huruf s . Yaitu , varians populasi adalah σ 2 dan standar deviasi populasi adalah σ , sedangkan varians sampel diwakili oleh s 2 dan standar deviasi sampel diwakili oleh s .

Perbedaan 2: Mereka dihitung dengan rumus yang berbeda

Standar deviasi populasi dan sampel dihitung sebagai akar kuadrat positif dari masing-masing varians, yaitu:

Perbedaan antara standar deviasi populasi dan sampel

Namun, variansi populasi dan sampel dihitung dengan menggunakan rumus yang sedikit berbeda. Dalam kasus varians populasi, ini dihitung sebagai rata-rata deviasi kuadrat dari setiap datum sehubungan dengan rata-rata populasi. Yaitu, dihitung dengan salah satu ekspresi setara berikut:

Perbedaan antara standar deviasi populasi dan sampel

Dimana x i mewakili nilai setiap item data dalam populasi, μ mewakili rata-rata populasi, dan N adalah ukuran populasi. Oleh karena itu, standar deviasi populasi dihitung sebagai:

Perbedaan antara standar deviasi populasi dan sampel

Alih-alih membaginya dengan jumlah titik data, n , seperti yang diharapkan, varians sampel dihitung dengan membagi jumlah deviasi kuadrat dari rata-rata sampel dengan n – 1 . Dengan kata lain, varians sampel dihitung sebagai:

Perbedaan antara standar deviasi populasi dan sampel

Di mana x i mewakili nilai setiap item data dalam sampel, x̄ mewakili rata-rata sampel, dan n adalah ukuran sampel. Mengingat hal di atas, standar deviasi sampel dihitung sebagai:

Perbedaan antara standar deviasi populasi dan sampel

Pembenaran untuk membagi dengan n – 1 bukan n

Sebuah pertanyaan umum yang muncul ketika membandingkan standar deviasi populasi dan sampel adalah mengapa membagi dengan n – 1 dan bukan dengan n ? Alasannya sangat sederhana.

Seperti disebutkan sebelumnya, perhitungan statistik seperti standar deviasi sampel berusaha untuk menetapkan estimator yang sedekat mungkin dengan parameter populasi masing-masing. Ini berarti bahwa standar deviasi sampel harus dihitung sedemikian rupa sehingga hasilnya sedekat mungkin dengan standar deviasi populasi.

Ini akan menyarankan bahwa mereka harus dihitung dengan rumus yang setara, tetapi tidak selalu demikian. Masalahnya adalah standar deviasi sampel mengukur penyebaran di sekitar rata-rata sampel, bukan rata-rata populasi. Meskipun rata-rata sampel adalah statistik yang digunakan sebagai penaksir rata-rata populasi, itu tidak persis sama dengannya. Hal ini menyebabkan nilai individu dalam setiap sampel menjadi lebih dekat dengan rata-rata sampel (yang sebenarnya merupakan ukuran kecenderungan sentral untuk data tersebut) daripada dengan rata-rata populasi. Jatuh tempo,

Untuk mengoreksi perbedaan ini, satu unit dikurangi dari penyebut untuk membuat standar deviasi sampel lebih besar, dan karena itu lebih dekat dengan standar deviasi populasi.

Perbedaan 3: Mereka jarang sama

Terlepas dari koreksi yang dapat dilakukan terhadap standar deviasi sampel, jarang sama dengan standar deviasi populasi. Hal ini karena dalam suatu populasi, data dapat bervariasi secara acak, sehingga sampel yang berbeda akan menghasilkan standar deviasi sampel yang berbeda pula. Faktanya, ada distribusi keseluruhan nilai yang mungkin dari standar deviasi sampel tergantung pada ukuran sampel.

Perbedaan 4: Standar deviasi sampel selalu dapat diketahui atau ditentukan, sedangkan standar deviasi populasi hampir tidak pernah diketahui secara pasti.

Perbedaan penting lainnya antara kedua ukuran dispersi ini adalah bahwa standar deviasi populasi (dan bahkan parameter populasi apa pun) jarang diketahui. Hal ini disebabkan, dalam beberapa kasus, keterbatasan teknis atau ekonomi, karena sangat mahal dan, lebih jauh lagi, tidak mungkin dapat mengukur secara mutlak semua data populasi. Dalam kasus lain, menentukan parameter populasi tidak mungkin dilakukan, baik karena populasinya tidak terbatas, atau hanya karena kita tidak memiliki akses ke semua elemen penyusunnya.

Dengan kata lain, kita hampir tidak pernah mengetahui semua nilai N dari xi dalam suatu populasi, sehingga tidak mungkin untuk menghitung rata-rata populasi, varians, dan, dengan perluasan, standar deviasi . Hal terbaik yang dapat kita ketahui adalah perkiraan titik dari suatu parameter seperti standar deviasi, atau interval nilai di mana kita memiliki tingkat kepercayaan tertentu bahwa standar deviasi atau parameter populasi lainnya berada.

Sebaliknya, dalam kasus sampel, kami mengetahui semua data, jadi kami selalu dapat menghitung standar deviasi sampel apa pun, berapa pun ukurannya.

Ringkasan perbedaan antara standar deviasi populasi dan sampel

Tabel berikut meringkas perbedaan antara simpangan baku populasi dan simpangan baku sampel yang dibahas di bagian sebelumnya:

Ciri Deviasi standar populasi Contoh standar deviasi
Simbol σ Ya
Ini dihitung untuk data populasi contoh data
Cabang statistik di mana ia digunakan Statistik deskriptif statistik inferensial
Jenis ukuran Parameter Statistik
Rumus Bagilah dengan N, ukuran populasi Bagilah dengan n – 1, di mana n adalah ukuran sampel
Variabilitas Itu tetap untuk populasi tertentu pada waktu tertentu Bervariasi dari sampel ke sampel, terlepas dari apakah sampel berukuran sama dan diambil dari populasi yang sama
Kepastian nilainya Hal ini umumnya tidak diketahui. Hanya perkiraan yang tersedia. Diketahui untuk setiap sampel

Referensi

Pusat pembelajaran masyarakat. (td). Deviasi Standar . http://www.cca.org.mx/cca/cursos/estadistica/html/m11/desviacion_estandar.htm

Levy Sarfin, R.(sf). Apa perbedaan antara sampel dan standar deviasi populasi . Suara. https://pyme.lavoztx.com/what-is-the-difference-entre-la-sample-and-the-standard-deviation-of-the-population-5641.html

MateMobile. (2021, 1 Januari). Varians dan standar deviasi, contoh dan latihan . https://matemovil.com/varianza-y-desviacion-estandar-ejemplos-y-ejercicios/

Molina, M. (2016, 27 Januari). Mengapa menyisihkan satu? Memperkirakan parameter populasi . Membius. https://anestesiar.org/2016/por-que-sobra-uno-estimando-parametros-de-la-poblacion/

Serra, BR (2020, 26 Oktober). Deviasi tipikal atau standar . Formula Alam Semesta. https://www.universoformulas.com/estadistica/descriptiva/desviacion-típica/

-Iklan-

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados