Tabla de Contenidos
ความแปรปรวนและค่าเบี่ยงเบนมาตรฐานเป็นสองเงื่อนไขที่มีความสำคัญอย่างยิ่ง ทั้งในสถิติและในสาขาวิทยาศาสตร์และวิศวกรรมศาสตร์ทุกแขนง ทั้งสองอย่างเป็นการวัดการกระจายตัวตามค่ากลางแต่สามารถกำหนดได้หลายวิธีขึ้นอยู่กับบริบทที่ใช้
ในด้านสถิติและความน่าจะเป็น ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานจะวัดว่าค่าของตัวแปรสุ่ม (แสดงด้วยตัวอักษร X เกือบทุกครั้ง) แตกต่างจากค่าเฉลี่ยเท่าใด
อย่างไรก็ตาม เมื่อใช้คำศัพท์เหล่านี้ในทางวิทยาศาสตร์หรือวิศวกรรม ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานหมายถึงการกระจายตัวของชุดข้อมูล ไม่ว่าจะเป็นประชากรทั้งหมดหรือกลุ่มตัวอย่าง รอบค่าเฉลี่ยประชากรหรือกลุ่มตัวอย่าง ค่าเบี่ยงเบนมาตรฐานของชุดการวัดซ้ำโดยใช้เครื่องมือวัดเดียวกันมักจะใช้เพื่อให้แนวคิดเกี่ยวกับระดับความแม่นยำของเครื่องมือดังกล่าว
ในกรณีแรก ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานจะวัดความแปรปรวนของตัวแปรสุ่ม ในขณะที่กรณีที่สอง จะวัดการกระจายตัวของข้อมูลการทดลอง ในทั้งสองกรณี ค่าความแปรปรวนหรือค่าเบี่ยงเบนมาตรฐานที่เป็นศูนย์บ่งชี้ว่าไม่มีการเปลี่ยนแปลงใดๆ เลย (ตัวแปรสุ่มเป็นค่าคงที่จริง ๆ หรือข้อมูลทั้งหมดเหมือนกันทุกประการ) ในขณะที่ค่าสูงบ่งชี้ว่าตรงกันข้าม
คำสองคำนี้เกี่ยวข้องกันอย่างใกล้ชิดและบางครั้งอาจทำให้สับสนได้ อย่างไรก็ตาม มีความแตกต่างที่สำคัญระหว่างสองคำนี้ซึ่งเราจะพูดถึงทันที
ความแตกต่างระหว่างความแปรปรวนและส่วนเบี่ยงเบนมาตรฐาน
1. พวกเขามีคำจำกัดความที่แตกต่างกัน
ความแตกต่างประการแรกระหว่างคำศัพท์ทางสถิติสองคำนี้คือคำจำกัดความ:
นิยามของความแปรปรวน
ในสถิติ ความแปรปรวนถูกกำหนดให้เป็นค่าที่คาดหวังของกำลังสองของผลต่างระหว่างค่าของตัวแปรสุ่มและค่าเฉลี่ย
ในทางคณิตศาสตร์เขียนเป็น:
ในวิธีที่ไม่เป็นทางการเล็กน้อย มันสามารถกำหนดเป็นค่าเฉลี่ยของกำลังสองของความแตกต่างระหว่างข้อมูลแต่ละรายการของชุดข้อมูล (ประชากรหรือกลุ่มตัวอย่าง) และค่าเฉลี่ย
นิยามส่วนเบี่ยงเบนมาตรฐาน
โดยไม่คำนึงถึงบริบทที่ใช้ ส่วนเบี่ยงเบนมาตรฐานหรือที่เรียกว่าส่วนเบี่ยงเบนมาตรฐานถูกกำหนดให้เป็นรากที่สองที่เป็นบวกของความแปรปรวน
ในทางคณิตศาสตร์เขียนเป็น:
2. พวกเขาแสดงด้วยสัญลักษณ์ที่แตกต่างกัน
ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานจะแสดงในรูปแบบต่างๆ ทั้งในข้อความสถิติและในสูตรและสมการ:
ความแปรปรวน:
- σ 2เมื่ออ้างถึงความแปรปรวนของประชากร
- S 2เมื่ออ้างถึงความแปรปรวนตัวอย่าง
- Var(X) เมื่ออ้างถึงความแปรปรวนของตัวแปรสุ่ม ในกรณีนี้คือ X
ส่วนเบี่ยงเบนมาตรฐาน:
- σ เมื่ออ้างถึงส่วนเบี่ยงเบนมาตรฐานของประชากร
- S เมื่ออ้างถึงส่วนเบี่ยงเบนมาตรฐานตัวอย่าง
- SD(X) เมื่ออ้างถึงส่วนเบี่ยงเบนมาตรฐานของตัวแปรสุ่ม ในกรณีนี้คือ X
3. พวกเขามีสูตรที่แตกต่างกัน
สำหรับทั้งความแปรปรวนและส่วนเบี่ยงเบนมาตรฐาน มีสองสูตร ขึ้นอยู่กับว่าชุดข้อมูลที่คำนวณความแปรปรวนหรือส่วนเบี่ยงเบนมาตรฐานเป็นข้อมูลจากประชากรหรือจากตัวอย่าง
สูตรความแปรปรวนของประชากร (σ 2 )
ในสูตรใดสูตรหนึ่งจากสองสูตรสำหรับความแปรปรวนของประชากรμแทนค่าเฉลี่ยประชากรX iแทนค่าข้อมูลประชากรที่ i และNแทนขนาดของประชากรหรือจำนวนจุดข้อมูลทั้งหมด
สูตรความแปรปรวนตัวอย่าง (S 2 )
ในที่นี้x-barแทนค่าเฉลี่ยของข้อมูลตัวอย่าง (ค่าเฉลี่ยตัวอย่าง) x iแทนค่าของข้อมูลตัวอย่าง i และnแทนขนาดหรือจำนวนข้อมูลทั้งหมดในตัวอย่าง
สูตรค่าเบี่ยงเบนมาตรฐานของประชากร (σ)
ในกรณีของส่วนเบี่ยงเบนมาตรฐาน สามารถคำนวณได้สามวิธี:
ตัวอย่างสูตรส่วนเบี่ยงเบนมาตรฐาน
ที่นี่สามารถใช้หนึ่งในสามวิธีที่แตกต่างกัน:
ต้องทำหมายเหตุเกี่ยวกับสองสูตรสุดท้าย เป็นเรื่องปกติที่เมื่อคำนวณค่าเบี่ยงเบนมาตรฐาน ความแปรปรวนจะถูกคำนวณก่อน แล้วจึงหาค่ารากที่สอง ค่าเบี่ยงเบนมาตรฐานหาได้ยากโดยใช้สมการหลังโดยไม่คำนวณความแปรปรวนก่อน ดังนั้นสมการแรกมักจะนำหน้าสมการหลังเสมอ
4. มีหน่วยต่างกัน
ทั้งหน่วยของความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานขึ้นอยู่กับลักษณะและหน่วยของข้อมูลหรือตัวแปรสุ่มที่พวกเขาอ้างถึง อย่างไรก็ตาม หน่วยจะแตกต่างกันในแต่ละกรณี
ค่าเบี่ยงเบนมาตรฐานมีหน่วยเดียวกับข้อมูลต้นฉบับหรือตัวแปรสุ่ม ในขณะที่ความแปรปรวนมีหน่วยเป็นกำลังสอง
ตัวอย่าง:
หากคุณมีข้อมูลน้ำหนักเป็นกิโลกรัม (กก.) ของกลุ่มตัวอย่างนักเรียนชั้นประถมศึกษาปีที่ 8 ในสถาบันการศึกษาแห่งหนึ่ง ความแปรปรวนของข้อมูลดังกล่าวจะมีหน่วยเป็นกิโลกรัม 2 ในขณะที่ส่วนเบี่ยงเบนมาตรฐานจะมีหน่วยเป็นกิโลกรัม
5. พวกเขาตีความต่างกัน
สำหรับทั้งความแปรปรวนและส่วนเบี่ยงเบนมาตรฐาน การตีความจะเหมือนกับที่กล่าวไว้แล้ว: ถ้าค่าเหล่านี้มีค่าเป็นศูนย์ แสดงว่าไม่มีการกระจายและข้อมูลทั้งหมดจะเท่ากันทุกประการ หากมีค่าน้อยก็จะมีการกระจายเล็กน้อยและหากมีค่ามากก็จะมีการกระจายมาก
อย่างไรก็ตาม เมื่อเข้าใจว่าค่ามากหรือน้อยหมายความว่าอย่างไร ค่าเบี่ยงเบนมาตรฐานจะตีความได้ง่ายกว่าค่าความแปรปรวนเนื่องจากอยู่ในหน่วยเดียวกับข้อมูล มันไม่ง่ายเลยในกรณีของความแปรปรวน
6. พวกเขาแตกต่างกันในความไวต่อค่ามาก
ในฐานะที่เป็นมาตรการของการกระจายทั้งความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานต้องทนทุกข์ทรมานจากความไวต่อการมีอยู่ของค่าที่มากเกินไป (ไม่ว่าจะสูงหรือต่ำมาก) ซึ่งหมายความว่าเมื่ออธิบายชุดข้อมูลที่ข้อมูลทั้งหมดมีความคล้ายคลึงกันมาก ยกเว้นชุดข้อมูลที่ใหญ่กว่าหรือเล็กกว่าชุดอื่นๆ มาก ทั้งความแปรปรวนหรือส่วนเบี่ยงเบนมาตรฐานจะไม่แสดงถึงการแพร่กระจายของข้อมูลได้ดี (ทั้งคู่จะให้ค่าขนาดใหญ่ แม้ว่าข้อมูลส่วนใหญ่จะแสดงการกระจายตัวน้อยมากก็ตาม)
อย่างไรก็ตาม เมื่อเปรียบเทียบความแปรปรวนกับส่วนเบี่ยงเบนมาตรฐาน ความแปรปรวนจะไวต่อค่าผิดปกติเหล่านี้มากกว่า เนื่องจากค่าเบี่ยงเบนทั้งหมดเป็นกำลังสอง ในขณะที่ค่าเบี่ยงเบนมาตรฐานไม่ใช่
7. คุณสมบัติทางคณิตศาสตร์ต่างกัน
ความแตกต่างสุดท้ายที่เราจะพิจารณานั้น จริงๆ แล้วครอบคลุมความแตกต่างที่ลึกกว่านั้นหลายประการ ซึ่งมีความสำคัญต่อนักสถิติเป็นหลัก (หรือผู้ที่ศึกษาสถิติ)
เนื่องจากฟังก์ชันทางคณิตศาสตร์ ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานแตกต่างกันในแง่ของผลของการคูณข้อมูลด้วยค่าคงที่ ผลของการเพิ่มค่าคงที่ การเพิ่มตัวแปรสุ่มเข้าด้วยกัน การเพิ่มกำลัง และอื่นๆ
อย่างไรก็ตาม ความแตกต่างเหล่านี้อยู่นอกเหนือขอบเขตของบทความนี้
ตัวอย่างการคำนวณความแปรปรวนและส่วนเบี่ยงเบนมาตรฐาน
สมมติว่ามีการชั่งน้ำหนักตัวอย่างวัว 12 ตัวจากผู้ผลิตในท้องถิ่น น้ำหนักเป็นกิโลกรัมแสดงไว้ด้านล่าง:
507 | 497 | 510 | 508 | 491 | 510 |
500 | 509 | 496 | 491 | 505 | 503 |
คุณจะต้องระบุความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างนี้
สารละลาย
ตามที่กล่าวไว้ข้างต้น เมื่อมีชุดข้อมูล จะเป็นการสะดวกที่จะกำหนดความแปรปรวนก่อนแล้วจึงหาค่าเบี่ยงเบนมาตรฐาน
การคำนวณความแปรปรวนตัวอย่าง (S 2 )
เราจะใช้สูตรความแปรปรวนตัวอย่างที่สอง เนื่องจากเป็นสูตรที่ใช้ได้จริงมากกว่า โดยทำตามขั้นตอนต่อไปนี้:
- ขั้นตอนที่ 1:รายการแนวตั้งประกอบด้วยข้อมูลทั้งหมด
- ขั้นตอนที่ 2:กำลังสองของแต่ละข้อมูลจะถูกคำนวณและเขียนถัดจากนั้นในคอลัมน์ใหม่
- ขั้นตอนที่ 3:เพิ่มข้อมูลทั้งหมดและผลลัพธ์จะถูกบันทึกที่ส่วนท้ายของคอลัมน์แรก
- ขั้นตอนที่ 4:เพิ่มกำลังสองทั้งหมดและเขียนผลลัพธ์ที่ด้านล่างของคอลัมน์ที่สอง
สรุป 5 ขั้นตอนแรกเหล่านี้ได้ในตารางต่อไปนี้:
สี_ | x ฉัน2 |
500 | 250000 |
509 | 259081 |
496 | 246016 |
491 | 241081 |
505 | 255025 |
503 | 253009 |
507 | 257049 |
497 | 247009 |
510 | 260100 |
508 | 258064 |
491 | 241081 |
510 | 260100 |
∑สี_ | ∑X ฉัน2 |
6027 | 3027615 |
- ขั้นตอนที่ 5:สูตรที่ใช้ในการคำนวณความแปรปรวน:
ดังนั้นความแปรปรวนของตัวอย่างจึงมีค่าประมาณ S 2 = 50 กก. 2
การคำนวณค่าเบี่ยงเบนมาตรฐานตัวอย่าง (S)
ตอนนี้เรามีความแปรปรวนแล้ว การคำนวณส่วนเบี่ยงเบนมาตรฐานทำได้ง่ายเพียงแค่หารากที่สองของตัวแรก:
ดังที่เห็นได้จากการเปรียบเทียบส่วนเบี่ยงเบนมาตรฐานซึ่งเท่ากับ 7 กิโลกรัมกับน้ำหนักเฉลี่ยของวัวซึ่งเท่ากับ 502.25 กิโลกรัม (คำนวณแยกต่างหาก) ทำให้เราสามารถสรุปได้ว่าตัวอย่างนี้มีการกระจายตัวต่ำเนื่องจากเป็นเพียง 1.4% ของน้ำหนักเฉลี่ยของวัว
อ้างอิง
Espinoza, CI และ Echecopar, AL (2020) แอปพลิเคชันทางสถิติโดยใช้ MS Excel พร้อมตัวอย่างทีละขั้นตอน (ฉบับภาษาสเปน) ( ฉบับ ที่ 1 ) ลิมา เปรู: Luis Felipe Arizmendi Echecopar และ Duo Negocios SAC
อินเวสโทพีเดีย. (2564, 16 เมษายน). เรียนรู้วิธีการหาค่าเบี่ยงเบนมาตรฐานโดยใช้ความแปรปรวน สืบค้นเมื่อวันที่ 24 กรกฎาคม 2021 จากhttps://www.investopedia.com/ask/answers/021215/what-difference-between-standard-deviation-and-variance.asp
โลเปซ เจเอฟ (18 พฤศจิกายน 2017) ความแปรปรวน สืบค้นจากhttps://economipedia.com/definiciones/varianza.html
สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ. (น). คำจำกัดความพื้นฐานของความไม่แน่นอน สืบค้นเมื่อ 24 กรกฎาคม 2021 จากhttps://physics.nist.gov/cuu/Uncertainty/basic.html
เว็บสเตอร์, อ. (2544). สถิติประยุกต์กับธุรกิจและเศรษฐกิจ (ฉบับภาษาสเปน) . โตรอนโต แคนาดา: Irwin Professional Publishing