Каква е разликата между дисперсия и стандартно отклонение?

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.

Дисперсията и стандартното отклонение са два термина с голямо значение, както в статистиката, така и във всички клонове на науката и инженерството. И двете са мерки за дисперсия по отношение на централна стойност, но в зависимост от контекста, в който се използват, те могат да бъдат определени по различни начини.

В областта на статистиката и вероятността дисперсията и стандартното отклонение измерват доколко стойностите на случайна променлива (почти винаги представена с буквата X) се различават от тяхната средна стойност.

Въпреки това, когато тези термини се използват в науката или инженерството, дисперсията и стандартното отклонение се отнасят до дисперсията на серия от данни, или на цяла популация, или на извадка, около средната популация или извадка. Стандартното отклонение на серия от повтарящи се измервания с помощта на един и същ измервателен уред също често се използва, за да се даде представа за нивото на точност на споменатия уред.

Стандартното отклонение на серия от повтарящи се измервания дава представа за нивото на точност на измервателния уред.

В първия случай дисперсията и стандартното отклонение измерват променливостта на случайна променлива, докато във втория измерват дисперсията на експерименталните данни. И в двата случая вариация или стандартно отклонение от нула показва, че изобщо няма вариация (случайната променлива всъщност е постоянна или всички данни са абсолютно еднакви), докато високата стойност показва обратното.

Тези два термина са тясно свързани и понякога могат да бъдат объркани един с друг, но има ключови разлики между двата, които ще разгледаме веднага.

Разлики между дисперсията и стандартното отклонение

1. Те ​​имат различни определения

Първата разлика между тези два статистически термина е тяхното определение:

Дефиниция на дисперсия

В статистиката дисперсията се определя като очакваната стойност на квадрата на разликата между стойността на случайна променлива и нейната средна стойност.

Математически това се записва като:

Статистическа дефиниция на дисперсията

По малко по-малко формален начин, той може да се дефинира и като средна стойност на квадратите на разликите между отделните данни на серия от данни (съвкупност или извадка) и нейната средна стойност.

Определение на стандартното отклонение

Независимо от контекста, в който се използва, стандартното отклонение, известно още като стандартно отклонение, се определя като положителен корен квадратен от дисперсията.

Математически това се записва като:

Статистическа дефиниция на стандартното отклонение.

2. Те са представени с различни символи

Дисперсията и стандартното отклонение се представят по различни начини както в статистическите текстове, така и във формулите и уравненията:

Разлика:

  • σ 2 , когато се отнася до дисперсията на съвкупността
  • S 2 , когато се отнася до дисперсията на извадката
  • Var(X), когато се отнася до дисперсията на случайна променлива, в този случай X.

Стандартно отклонение:

  • σ, когато се отнася до стандартното отклонение на популацията
  • S, когато се отнася до стандартното отклонение на извадката
  • SD(X), когато се отнася до стандартното отклонение на случайна променлива, в този случай X.

3. Имат различни формули

Както за дисперсията, така и за стандартното отклонение има две формули в зависимост от това дали сериите от данни, за които се изчислява дисперсията или стандартното отклонение, са данни от популация или от извадка.

Формула за дисперсия на популацията (σ 2 )

Формули за дисперсията на съвкупността от дисперсии

Във всяка от двете формули за дисперсията на популацията μ представлява средната стойност на популацията, X i представлява i-тата стойност на данните за популацията, а N представлява размера на популацията или общия брой точки с данни.

Примерна формула за дисперсия (S 2 )

формули за дисперсия на извадката

Тук x-лента представлява средната стойност на данните от извадката (средна стойност на извадката), x i представлява стойността на i-тите данни от извадката, а n представлява размера или общия брой данни в извадката.

Формула за стандартно отклонение на популацията (σ)

В случай на стандартно отклонение, то може да се изчисли по три различни начина:

Формула за стандартното отклонение на популацията.

Друга формула за стандартното отклонение на популацията

Практическа формула за стандартното отклонение на популацията.

Примерна формула(и) за стандартно отклонение

Тук също може да се използва един от три различни начина:

Формула за извадково стандартно отклонение.

Друга формула за извадково стандартно отклонение.

Практическа формула за стандартно отклонение на извадката.

Трябва да се направи бележка по отношение на последните две формули. Обичайно е, че при изчисляване на стандартното отклонение първо се изчислява дисперсията и след това се изважда квадратният корен. Стандартното отклонение рядко се определя с помощта на последните уравнения, без първо да се изчисли дисперсията, така че първото почти винаги предшества второто.

4. Те имат различни единици

И единиците на дисперсията, и стандартното отклонение зависят от естеството и единиците на данните или случайната променлива, за която се отнасят, но единиците са различни във всеки случай.

Стандартното отклонение има същите единици като оригиналните данни или случайната променлива, докато дисперсията е в тези единици на квадрат.

Пример:

Ако разполагате с данните за теглата в килограми (kg) на извадка от ученици от 8 клас в определена образователна институция, тогава дисперсията на тези данни ще има единици kg 2, докато стандартното отклонение ще бъде в kg .

5. Те се различават в тълкуването си

Както за дисперсията, така и за стандартното отклонение интерпретацията е същата като вече споменатата: ако те са на стойност нула, тогава няма дисперсия и всички данни са точно равни една на друга; ако са малки стойности, тогава ще има малко разсейване, а ако са големи, ще има много разсейване.

интерпретация на дисперсия и стандартно отклонение.

Въпреки това, когато разбираме какво означава да бъдеш голяма или малка стойност, стойностите на стандартното отклонение са много по-лесни за тълкуване от стойностите на дисперсията, тъй като те са в същите единици като данните. Това не е толкова просто в случай на дисперсия.

6. Те се различават по своята чувствителност към екстремни стойности

Като мерки за дисперсия, както дисперсията, така и стандартното отклонение страдат от чувствителност към съществуването на екстремни стойности (много високи или много ниски). Това означава, че когато се описва серия от данни, в която всички данни са много сходни с изключение на една, която е много по-голяма или по-малка от останалите, нито дисперсията, нито стандартното отклонение ще представят добре разпространението на данните (и двете ще дадат големи стойности въпреки факта, че по-голямата част от данните показват много малка дисперсия).

Въпреки това, когато се сравнява дисперсията със стандартното отклонение, дисперсията е много по-чувствителна към тези отклонения, тъй като всички отклонения са на квадрат, докато стандартното отклонение не е.

7. Те се различават по своите математически свойства

Последната разлика, която ще разгледаме, всъщност обхваща няколко много по-дълбоки разлики, които са важни предимно за статистиците (или тези, които изучават статистика).

Като математически функции, дисперсията и стандартното отклонение се различават по отношение на ефекта от умножаването на данните по константа, ефекта от добавянето на константи, добавянето на случайни променливи заедно, повдигането на степен и т.н.

Тези разлики обаче са извън обхвата на тази статия.

Пример за изчисляване на дисперсия и стандартно отклонение

Да предположим, че е претеглена проба от 12 бика от местен производител. Теглата в килограми са представени по-долу:

507 497 510 508 491 510
500 509 496 491 505 503

От вас се иска да определите дисперсията и стандартното отклонение на тази проба.

РЕШЕНИЕ

Както бе споменато по-горе, когато имате серия от данни, е удобно първо да се определи дисперсията и след това стандартното отклонение.

Изчисляване на дисперсията на извадката (S 2 )

Ще използваме втората примерна формула за дисперсия, тъй като е по-практична. За целта се следват следните стъпки:

  • Стъпка 1: Създава се вертикален списък от всички данни
  • Стъпка 2: Квадратът на всяка информация се изчислява и се записва до нея в нова колона.
  • Стъпка 3: Всички данни се добавят и резултатът се записва в края на първата колона.
  • Стъпка 4: Съберете всички квадратчета и запишете резултата в края на втората колона.

Тези първи 5 стъпки са обобщени в следната таблица:

Xi _ x i 2
500 250 000
509 259081
496 246016
491 241081
505 255025
503 253009
507 257049
497 247009
510 260100
508 258064
491 241081
510 260100
∑Xi _ ∑X i 2
6027 3027615
  • Стъпка 5: Формулата се използва за изчисляване на дисперсията:
Пример за изчисляване на дисперсията

Така дисперсията на пробата е приблизително S 2 = 50 kg 2 .

Изчисляване на стандартното отклонение на извадката (S)

Сега, когато имаме дисперсията, изчисляването на стандартното отклонение е толкова просто, колкото да извадим корен квадратен от първото:

Примерен пример за изчисление на стандартното отклонение

Както може да се види, сравнението на стандартното отклонение, което е 7 килограма, със средното тегло на биковете, което е 502,25 килограма (изчислено отделно), ни позволява да заключим, че тази проба има ниска дисперсия, тъй като е само 1,4% от средното тегло на биковете.

Препратки

Espinoza, CI, & Echecopar, AL (2020). Статистически приложения, използващи MS Excel с примери стъпка по стъпка (испанско издание) (1-во издание ). Лима, Перу: Луис Фелипе Аризменди Ечекопар и Дуо Негосиос SAC.

Инвестопедия. (2021, 16 април). Научете как стандартното отклонение се определя чрез използване на дисперсия. Извлечено на 24 юли 2021 г. от https://www.investopedia.com/ask/answers/021215/what-difference-between-standard-deviation-and-variance.asp

Lopez, JF (18 ноември 2017 г.). Дисперсия . Извлечено от https://economipedia.com/definiciones/varianza.html

Национален институт по стандарти и технологии. (nd). Основни дефиниции на несигурността. Извлечено на 24 юли 2021 г. от https://physics.nist.gov/cuu/Uncertainty/basic.html

Уебстър, А. (2001). Статистика, приложена към бизнеса и икономиката (испанско издание) . Торонто, Канада: Irwin Professional Publishing.

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados