ความแตกต่างระหว่างค่าเบี่ยงเบนมาตรฐานของประชากรและกลุ่มตัวอย่าง

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.

Tabla de Contenidos


ในสถิติเชิงพรรณนามีชุดของการวัดที่ช่วยให้เราสามารถสังเกตลักษณะทั่วไปที่แตกต่างกันของข้อมูลของประชากรได้ บางส่วนใช้เพื่อวัดแนวโน้มเข้าสู่ศูนย์กลางของข้อมูล ในขณะที่บางส่วนพยายามที่จะให้แนวคิดเกี่ยวกับความแปรปรวนหรือการกระจายตัวของข้อมูล นั่นคือ วิธีการกระจายข้อมูลรอบแนวโน้มเข้าสู่ศูนย์กลางดังกล่าว

การวัดความแปรปรวนหรือการกระจายที่สำคัญสองประการคือความแปรปรวนและส่วนเบี่ยงเบนมาตรฐาน การวัดทั้งสองนี้มีความสัมพันธ์อย่างใกล้ชิด อย่างไรก็ตาม มีความแปรปรวนสองรูปแบบและส่วนเบี่ยงเบนมาตรฐานที่สอดคล้องกันสองรูปแบบได้แก่ ประชากรและกลุ่มตัวอย่าง

ประชากรเทียบกับตัวอย่างสรุปทางสถิติ

เป็นเรื่องที่ควรค่าแก่การสังเกตข้อเท็จจริงที่มีความสำคัญอย่างยิ่ง และนั่นคือ ในทางสถิติ โดยทั่วไปแล้วจะมีการวัดผล 2 รูปแบบซึ่งสรุปพฤติกรรมของชุดข้อมูลและใช้ในบริบทที่แตกต่างกัน

ในการเริ่มต้น เราต้องแยกความแตกต่างระหว่างข้อมูลจากประชากร (หรือข้อมูลประชากร) และข้อมูลจากกลุ่มย่อยของประชากรนั้น ซึ่งเรียกว่ากลุ่มตัวอย่าง แม้ว่าข้อมูลประชากรและข้อมูลกลุ่มตัวอย่างจะแยกไม่ออกในทางคณิตศาสตร์ แต่ในเชิงแนวคิดนั้นแตกต่างกันมาก

สำมะโนประชากร

ข้อมูลประชากรเป็นข้อมูลที่ได้มาจากการสำรวจสำมะโนทางสถิติ นั่นคือการวัดหรือวิเคราะห์แต่ละองค์ประกอบหรือบุคคลที่ประกอบกันเป็นประชากร (แน่นอนว่าตราบใดที่ยังมีจำนวนจำกัด) เมื่อเราคำนวณการวัดแนวโน้มเข้าสู่ส่วนกลางหรือการกระจายของข้อมูลประชากร เราได้รับมาตรการที่สรุปพฤติกรรมทั่วไปของประชากร ซึ่งเราเรียกว่าพารามิเตอร์ประชากรและเป็นค่าคงที่สำหรับประชากร (นั่นคือ ประชากรมีค่าเฉลี่ยเพียงค่าเดียว , หนึ่งโหมด, หนึ่งส่วนเบี่ยงเบนมาตรฐานฯลฯ ณ เวลาที่กำหนด) ในกรณีนี้ เราใช้สถิติเชิงพรรณนา

การสุ่มตัวอย่าง

ในทางกลับกัน ในหลาย ๆ สถานการณ์ เราดำเนินกระบวนการสุ่มตัวอย่างเพื่อวิเคราะห์องค์ประกอบบางอย่างของประชากรเท่านั้น จึงได้ข้อมูลตัวอย่าง ในกรณีเหล่านี้ เรายังสามารถใช้เครื่องมือของสถิติเชิงพรรณนาเพื่อสังเกตพฤติกรรมทั่วไปของข้อมูลเหล่านี้ได้ อย่างไรก็ตาม เราไม่ได้กำลังทำสถิติเชิงพรรณนาเกี่ยวกับประชากร เฉพาะในกลุ่มตัวอย่างเท่านั้น

การสรุปตัวเลขของตัวอย่างไม่ใช่พารามิเตอร์ แต่เรียกว่าสถิติ (แม้ว่าบางคนจะเรียกว่าสถิติด้วย) ซึ่งแตกต่างจากพารามิเตอร์สถิติจะแตกต่างกันไปในแต่ละตัวอย่างแม้ว่าตัวอย่างจะดึงมาจากประชากรกลุ่มเดียวกันก็ตาม เนื่องจากเมื่อเลือกชุดย่อยของประชากร จะมีองค์ประกอบต่างๆ ที่เป็นไปได้มากมายที่สามารถประกอบกันเป็นกลุ่มตัวอย่างได้ ด้วยเหตุนี้ โดยทั่วไปแล้ว กลุ่มตัวอย่างประกอบด้วยหัวข้อ บุคคล หรือองค์ประกอบที่แตกต่างกัน ทำให้เกิดสถิติที่แตกต่างกัน

วัตถุประสงค์สูงสุดของการคำนวณสถิติเหล่านี้ในตัวอย่างคือเพื่อให้สามารถใช้เป็นค่าประมาณของพารามิเตอร์ประชากรที่เกี่ยวข้องได้ กระบวนการอนุมานหรือประมาณค่าพฤติกรรมของข้อมูลประชากรจากข้อมูลตัวอย่างเป็นสิ่งที่สถิติเชิงอนุมาน รับผิดชอบ สิ่งนี้ทำให้ความแปรปรวนของประชากรและกลุ่มตัวอย่างและส่วนเบี่ยงเบนมาตรฐานแตกต่างกันอย่างมาก

แต่ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานคืออะไรกันแน่?

ความแปรปรวนคืออะไร?

ความแปรปรวนเป็นการวัดการกระจายจากค่าเฉลี่ยของชุดข้อมูล มันถูกกำหนดให้เป็นค่าเฉลี่ยของส่วนเบี่ยงเบนกำลังสองของข้อมูลทั้งหมดจากค่าเฉลี่ย ค่าเฉลี่ยของผลต่างกำลังสองจึงเป็นจำนวนบวกเสมอ

ค่าเบี่ยงเบนมาตรฐานคืออะไร?

ในทางกลับกัน ค่าเบี่ยงเบนมาตรฐานเป็นเพียงรากที่สองที่เป็นบวกของความแปรปรวน นอกจากนี้ยังวัดการกระจายตัวรอบค่าเฉลี่ย โดยวัดจากหน่วยข้อมูลและค่าเฉลี่ยเดียวกันเท่านั้น ทำให้เข้าใจและตีความได้ง่ายกว่าความแปรปรวน

เนื่องจากค่าเบี่ยงเบนมาตรฐานถูกคำนวณเป็นรากที่สองของความแปรปรวน จึงไม่สมเหตุสมผลที่จะพูดถึงประชากรและค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างโดยไม่พูดถึงประชากรและความแปรปรวนของกลุ่มตัวอย่าง

ความแตกต่างที่สำคัญที่สุดระหว่างการวัดทั่วไปของการกระจายตัวรอบค่าเฉลี่ยจะอธิบายโดยละเอียดในหัวข้อต่อไปนี้

ความแตกต่าง 1: ค่าเบี่ยงเบนมาตรฐานและความแปรปรวนของประชากรและตัวอย่างแสดงด้วยสัญลักษณ์ที่แตกต่างกัน

ความแตกต่างประการแรกที่ต้องพิจารณาเมื่อเปรียบเทียบค่าความแปรปรวนของประชากรและความแปรปรวนของกลุ่มตัวอย่างและค่าเบี่ยงเบนมาตรฐาน ของประชากรและกลุ่มตัวอย่าง คือสัญลักษณ์ที่ใช้แทนค่าเหล่านี้ ใน สถิติ ข้อมูล สรุปหรือพารามิเตอร์ที่เป็นตัวเลขของประชากรมักจะแสดงโดยใช้ตัวอักษรกรีกในขณะที่ตัวอย่างหรือเวอร์ชันทางสถิติจะแสดงด้วยตัวอักษรที่เทียบเท่าของตัวอักษรละติน

ในแง่นี้ ความแปรปรวนและค่าเบี่ยงเบนมาตรฐานของประชากรมีความเกี่ยวข้องกับซิกมาอักษรกรีกตัวพิมพ์ เล็กในขณะที่เวอร์ชันตัวอย่างจะแสดงด้วยตัวอักษรs นั่นคือความแปรปรวนของประชากรคือσ 2และส่วนเบี่ยงเบนมาตรฐานของประชากรคือσ ในขณะที่ความแปรปรวนของตัวอย่างแสดงแทนด้วยs 2และ ส่วนเบี่ยงเบน มาตรฐานของตัวอย่างแสดงด้วยs

ความแตกต่าง 2: คำนวณโดยใช้สูตรต่างๆ

ทั้งประชากรและส่วนเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างจะคำนวณเป็นค่ารากที่สองที่เป็นบวกของความแปรปรวนตามลำดับ นั่นคือ:

ความแตกต่างระหว่างค่าเบี่ยงเบนมาตรฐานของประชากรและกลุ่มตัวอย่าง

อย่างไรก็ตาม ประชากรและความแปรปรวนของกลุ่มตัวอย่างจะคำนวณโดยใช้สูตรที่แตกต่างกันเล็กน้อย ในกรณีของความแปรปรวนของประชากร ค่านี้จะคำนวณเป็นค่าเฉลี่ยของส่วนเบี่ยงเบนกำลังสองของแต่ละ Datum ที่เกี่ยวกับค่าเฉลี่ยของประชากร นั่นคือ คำนวณโดยหนึ่งในนิพจน์ที่เทียบเท่าต่อไปนี้:

ความแตกต่างระหว่างค่าเบี่ยงเบนมาตรฐานของประชากรและกลุ่มตัวอย่าง

โดยที่x iแทนค่าของแต่ละรายการข้อมูลในประชากรμ แทนค่าเฉลี่ยประชากร และ N คือขนาดของประชากร ดังนั้น ค่าเบี่ยงเบนมาตรฐานของประชากรจึงคำนวณได้ดังนี้

ความแตกต่างระหว่างค่าเบี่ยงเบนมาตรฐานของประชากรและกลุ่มตัวอย่าง

แทนที่จะหารด้วยจำนวนจุดข้อมูลn ตามที่คาดไว้ ความแปรปรวนตัวอย่างจะคำนวณโดยการหารผลรวมของการเบี่ยงเบนกำลังสองจากค่าเฉลี่ยตัวอย่างด้วยn – 1 กล่าวอีกนัยหนึ่ง ความแปรปรวนตัวอย่างคำนวณได้ดังนี้:

ความแตกต่างระหว่างค่าเบี่ยงเบนมาตรฐานของประชากรและกลุ่มตัวอย่าง

โดยที่x iแทนค่าของแต่ละรายการข้อมูลในตัวอย่าง x̄ แทนค่าเฉลี่ยตัวอย่าง และnคือขนาดตัวอย่าง จากมุมมองข้างต้น ค่าเบี่ยงเบนมาตรฐานตัวอย่างจะคำนวณดังนี้:

ความแตกต่างระหว่างค่าเบี่ยงเบนมาตรฐานของประชากรและกลุ่มตัวอย่าง

เหตุผลสำหรับการหารด้วย n – 1 แทน n

คำถามที่พบบ่อยที่เกิดขึ้นเมื่อเปรียบเทียบค่าเบี่ยงเบนมาตรฐานของประชากรและกลุ่มตัวอย่างคือเหตุใดจึงหารด้วยn – 1และไม่หารด้วยn ? เหตุผลนั้นง่ายมาก

ดังที่ได้กล่าวไว้ก่อนหน้านี้ การคำนวณสถิติ เช่น ค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างพยายามสร้างตัวประมาณค่าที่ใกล้เคียงกับพารามิเตอร์ของประชากรที่เกี่ยวข้องมากที่สุดเท่าที่จะเป็นไปได้ ซึ่งหมายความว่าควรคำนวณค่าเบี่ยงเบนมาตรฐานตัวอย่างในลักษณะที่ผลลัพธ์ใกล้เคียงกับค่าเบี่ยงเบนมาตรฐานของประชากรมากที่สุด

สิ่งนี้จะแนะนำว่าควรคำนวณด้วยสูตรที่เทียบเท่ากัน แต่ก็ไม่เสมอไป ปัญหาคือค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างวัดการแพร่กระจายรอบค่าเฉลี่ยตัวอย่าง ไม่ใช่ค่าเฉลี่ยประชากร แม้ว่าค่าเฉลี่ยตัวอย่างจะเป็นสถิติที่ใช้เป็นตัวประมาณค่าเฉลี่ยของประชากร แต่ก็ไม่เท่ากับค่าเฉลี่ยทั้งหมด สิ่งนี้ทำให้ค่าแต่ละค่าในแต่ละตัวอย่างใกล้เคียงกับค่าเฉลี่ยตัวอย่าง (ซึ่งก็คือการวัดแนวโน้มเข้าสู่ส่วนกลางของข้อมูลนั้น) มากกว่าค่าเฉลี่ยของประชากร เนื่องจาก,

เพื่อแก้ไขความคลาดเคลื่อนนี้ ให้ลบหนึ่งหน่วยออกจากตัวส่วนเพื่อทำให้ค่าเบี่ยงเบนมาตรฐานตัวอย่างใหญ่ขึ้น และดังนั้นจึงเข้าใกล้ค่าเบี่ยงเบนมาตรฐานของประชากรมากขึ้น

ความแตกต่าง 3: แทบไม่เหมือนกันเลย

โดยไม่คำนึงถึงการแก้ไขที่สามารถทำได้กับค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง ค่าเบี่ยงเบนมาตรฐานของประชากรแทบจะไม่เท่ากับ เนื่องจากภายในกลุ่มประชากร ข้อมูลอาจแปรผันแบบสุ่ม ดังนั้นตัวอย่างที่แตกต่างกันจะส่งผลให้ค่าเบี่ยงเบนมาตรฐานของตัวอย่างแตกต่างกัน ในความเป็นจริงมีการแจกแจงค่าที่เป็นไปได้ทั้งหมดของส่วนเบี่ยงเบนมาตรฐานตัวอย่างขึ้นอยู่กับขนาดของตัวอย่าง

ความแตกต่าง 4: ค่าเบี่ยงเบนมาตรฐานตัวอย่างสามารถทราบหรือกำหนดได้เสมอ ในขณะที่ค่าเบี่ยงเบนมาตรฐานของประชากรแทบไม่เคยทราบแน่ชัด

ข้อแตกต่างที่สำคัญอีกประการหนึ่งระหว่างการวัดการกระจายตัวทั้งสองนี้คือ ค่าเบี่ยงเบนมาตรฐานของประชากร (และพารามิเตอร์ของประชากรใดๆ) แทบไม่มีใครทราบ นี่เป็นเพราะข้อจำกัดทางเทคนิคหรือเศรษฐกิจในบางกรณี เนื่องจากมีราคาแพงมากและยิ่งไปกว่านั้น ไม่น่าจะสามารถวัดข้อมูลทั้งหมดของประชากรได้อย่างสมบูรณ์ ในกรณีอื่นๆ การกำหนดพารามิเตอร์ของประชากรนั้นเป็นไปไม่ได้เลย อาจเป็นเพราะจำนวนประชากรนั้นไม่มีที่สิ้นสุด หรือเพียงเพราะเราไม่สามารถเข้าถึงองค์ประกอบทั้งหมดที่ประกอบกันขึ้น

กล่าวอีกนัยหนึ่ง เราแทบไม่เคยรู้ ค่า N ทั้งหมด ของx iในประชากร ทำให้ไม่สามารถคำนวณค่าเฉลี่ยของประชากร ความแปรปรวน และส่วนเบี่ยงเบนมาตรฐานโดยการขยายได้ สิ่งที่ดีที่สุดที่เราสามารถรู้ได้คือการประมาณจุดของพารามิเตอร์ เช่น ค่าเบี่ยงเบนมาตรฐาน หรือช่วงของค่าที่เรามีระดับความเชื่อมั่นว่าค่าเบี่ยงเบนมาตรฐานหรือพารามิเตอร์ประชากรอื่นๆ อยู่

ในกรณีของตัวอย่าง ในทางกลับกัน เรารู้ข้อมูลทั้งหมด ดังนั้นเราจึงสามารถคำนวณค่าเบี่ยงเบนมาตรฐานของตัวอย่างใดๆ ก็ตาม ไม่ว่าขนาดของตัวอย่างจะเป็นเท่าใดก็ตาม

สรุปความแตกต่างระหว่างค่าเบี่ยงเบนมาตรฐานของประชากรและกลุ่มตัวอย่าง

ตารางต่อไปนี้สรุปความแตกต่างระหว่างส่วนเบี่ยงเบนมาตรฐานของประชากรและส่วนเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างที่กล่าวถึงในส่วนก่อนหน้า:

ลักษณะ ค่าเบี่ยงเบนมาตรฐานประชากร ค่าเบี่ยงเบนมาตรฐานตัวอย่าง
เครื่องหมาย σ ใช่
มันถูกคำนวณสำหรับ ข้อมูลประชากร ข้อมูลตัวอย่าง
สาขาสถิติที่ใช้ สถิติเชิงพรรณนา สถิติเชิงอนุมาน
ประเภทของการวัด พารามิเตอร์ ทางสถิติ
สูตร หารด้วย N ขนาดของประชากร หารด้วย n – 1 โดยที่ n คือขนาดตัวอย่าง
ความแปรปรวน ได้รับการแก้ไขสำหรับประชากรที่กำหนดในเวลาที่กำหนด แตกต่างกันไปในแต่ละตัวอย่าง โดยไม่คำนึงว่าตัวอย่างจะมีขนาดเท่ากันและดึงมาจากประชากรกลุ่มเดียวกันหรือไม่
มั่นใจในมูลค่าของมัน ไม่เป็นที่รู้จักโดยทั่วไป มีเพียงค่าประมาณของมันเท่านั้น เป็นที่รู้จักสำหรับแต่ละตัวอย่าง

อ้างอิง

ศูนย์การเรียนรู้ชุมชน. (น). ส่วน เบี่ยงเบนมาตรฐาน http://www.cca.org.mx/cca/cursos/estadistica/html/m11/desviacion_estandar.htm

เลวี ซาร์ฟิน, อาร์. (sf). อะไรคือความแตกต่างระหว่างตัวอย่างและส่วนเบี่ยงเบนมาตรฐานของประชากร . เสียง. https://pyme.lavaztx.com/what-is-the-difference-entre-la-sample-and-the-standard-deviation-of-the-population-5641.html

เมทโมบายล์. (2021, 1 มกราคม). ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐาน ตัวอย่าง และแบบฝึกหัด https://matemovil.com/varianza-y-desviacion-estandar-ejemplos-y-ejercicios/

Molina, M. (2016, 27 มกราคม) ทำไมต้องสำรอง? การประมาณค่า พารามิเตอร์ของประชากร ยาสลบ https://anestesiar.org/2016/por-que-sobra-uno-estimando-parametros-de-la-poblacion/

Serra, BR (2020, 26 ตุลาคม) โดยทั่วไปหรือส่วนเบี่ยงเบนมาตรฐาน สูตรจักรวาล https://www.universoformulas.com/estadistica/descriptiva/desviacion-típica/

-โฆษณา-

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados