Tabla de Contenidos
Дисперсията и стандартното отклонение са два термина с голямо значение, както в статистиката, така и във всички клонове на науката и инженерството. И двете са мерки за дисперсия по отношение на централна стойност, но в зависимост от контекста, в който се използват, те могат да бъдат определени по различни начини.
В областта на статистиката и вероятността дисперсията и стандартното отклонение измерват доколко стойностите на случайна променлива (почти винаги представена с буквата X) се различават от тяхната средна стойност.
Въпреки това, когато тези термини се използват в науката или инженерството, дисперсията и стандартното отклонение се отнасят до дисперсията на серия от данни, или на цяла популация, или на извадка, около средната популация или извадка. Стандартното отклонение на серия от повтарящи се измервания с помощта на един и същ измервателен уред също често се използва, за да се даде представа за нивото на точност на споменатия уред.
В първия случай дисперсията и стандартното отклонение измерват променливостта на случайна променлива, докато във втория измерват дисперсията на експерименталните данни. И в двата случая вариация или стандартно отклонение от нула показва, че изобщо няма вариация (случайната променлива всъщност е постоянна или всички данни са абсолютно еднакви), докато високата стойност показва обратното.
Тези два термина са тясно свързани и понякога могат да бъдат объркани един с друг, но има ключови разлики между двата, които ще разгледаме веднага.
Разлики между дисперсията и стандартното отклонение
1. Те имат различни определения
Първата разлика между тези два статистически термина е тяхното определение:
Дефиниция на дисперсия
В статистиката дисперсията се определя като очакваната стойност на квадрата на разликата между стойността на случайна променлива и нейната средна стойност.
Математически това се записва като:
По малко по-малко формален начин, той може да се дефинира и като средна стойност на квадратите на разликите между отделните данни на серия от данни (съвкупност или извадка) и нейната средна стойност.
Определение на стандартното отклонение
Независимо от контекста, в който се използва, стандартното отклонение, известно още като стандартно отклонение, се определя като положителен корен квадратен от дисперсията.
Математически това се записва като:
2. Те са представени с различни символи
Дисперсията и стандартното отклонение се представят по различни начини както в статистическите текстове, така и във формулите и уравненията:
Разлика:
- σ 2 , когато се отнася до дисперсията на съвкупността
- S 2 , когато се отнася до дисперсията на извадката
- Var(X), когато се отнася до дисперсията на случайна променлива, в този случай X.
Стандартно отклонение:
- σ, когато се отнася до стандартното отклонение на популацията
- S, когато се отнася до стандартното отклонение на извадката
- SD(X), когато се отнася до стандартното отклонение на случайна променлива, в този случай X.
3. Имат различни формули
Както за дисперсията, така и за стандартното отклонение има две формули в зависимост от това дали сериите от данни, за които се изчислява дисперсията или стандартното отклонение, са данни от популация или от извадка.
Формула за дисперсия на популацията (σ 2 )
Във всяка от двете формули за дисперсията на популацията μ представлява средната стойност на популацията, X i представлява i-тата стойност на данните за популацията, а N представлява размера на популацията или общия брой точки с данни.
Примерна формула за дисперсия (S 2 )
Тук x-лента представлява средната стойност на данните от извадката (средна стойност на извадката), x i представлява стойността на i-тите данни от извадката, а n представлява размера или общия брой данни в извадката.
Формула за стандартно отклонение на популацията (σ)
В случай на стандартно отклонение, то може да се изчисли по три различни начина:
Примерна формула(и) за стандартно отклонение
Тук също може да се използва един от три различни начина:
Трябва да се направи бележка по отношение на последните две формули. Обичайно е, че при изчисляване на стандартното отклонение първо се изчислява дисперсията и след това се изважда квадратният корен. Стандартното отклонение рядко се определя с помощта на последните уравнения, без първо да се изчисли дисперсията, така че първото почти винаги предшества второто.
4. Те имат различни единици
И единиците на дисперсията, и стандартното отклонение зависят от естеството и единиците на данните или случайната променлива, за която се отнасят, но единиците са различни във всеки случай.
Стандартното отклонение има същите единици като оригиналните данни или случайната променлива, докато дисперсията е в тези единици на квадрат.
Пример:
Ако разполагате с данните за теглата в килограми (kg) на извадка от ученици от 8 клас в определена образователна институция, тогава дисперсията на тези данни ще има единици kg 2, докато стандартното отклонение ще бъде в kg .
5. Те се различават в тълкуването си
Както за дисперсията, така и за стандартното отклонение интерпретацията е същата като вече споменатата: ако те са на стойност нула, тогава няма дисперсия и всички данни са точно равни една на друга; ако са малки стойности, тогава ще има малко разсейване, а ако са големи, ще има много разсейване.
Въпреки това, когато разбираме какво означава да бъдеш голяма или малка стойност, стойностите на стандартното отклонение са много по-лесни за тълкуване от стойностите на дисперсията, тъй като те са в същите единици като данните. Това не е толкова просто в случай на дисперсия.
6. Те се различават по своята чувствителност към екстремни стойности
Като мерки за дисперсия, както дисперсията, така и стандартното отклонение страдат от чувствителност към съществуването на екстремни стойности (много високи или много ниски). Това означава, че когато се описва серия от данни, в която всички данни са много сходни с изключение на една, която е много по-голяма или по-малка от останалите, нито дисперсията, нито стандартното отклонение ще представят добре разпространението на данните (и двете ще дадат големи стойности въпреки факта, че по-голямата част от данните показват много малка дисперсия).
Въпреки това, когато се сравнява дисперсията със стандартното отклонение, дисперсията е много по-чувствителна към тези отклонения, тъй като всички отклонения са на квадрат, докато стандартното отклонение не е.
7. Те се различават по своите математически свойства
Последната разлика, която ще разгледаме, всъщност обхваща няколко много по-дълбоки разлики, които са важни предимно за статистиците (или тези, които изучават статистика).
Като математически функции, дисперсията и стандартното отклонение се различават по отношение на ефекта от умножаването на данните по константа, ефекта от добавянето на константи, добавянето на случайни променливи заедно, повдигането на степен и т.н.
Тези разлики обаче са извън обхвата на тази статия.
Пример за изчисляване на дисперсия и стандартно отклонение
Да предположим, че е претеглена проба от 12 бика от местен производител. Теглата в килограми са представени по-долу:
507 | 497 | 510 | 508 | 491 | 510 |
500 | 509 | 496 | 491 | 505 | 503 |
От вас се иска да определите дисперсията и стандартното отклонение на тази проба.
РЕШЕНИЕ
Както бе споменато по-горе, когато имате серия от данни, е удобно първо да се определи дисперсията и след това стандартното отклонение.
Изчисляване на дисперсията на извадката (S 2 )
Ще използваме втората примерна формула за дисперсия, тъй като е по-практична. За целта се следват следните стъпки:
- Стъпка 1: Създава се вертикален списък от всички данни
- Стъпка 2: Квадратът на всяка информация се изчислява и се записва до нея в нова колона.
- Стъпка 3: Всички данни се добавят и резултатът се записва в края на първата колона.
- Стъпка 4: Съберете всички квадратчета и запишете резултата в края на втората колона.
Тези първи 5 стъпки са обобщени в следната таблица:
Xi _ | x i 2 |
500 | 250 000 |
509 | 259081 |
496 | 246016 |
491 | 241081 |
505 | 255025 |
503 | 253009 |
507 | 257049 |
497 | 247009 |
510 | 260100 |
508 | 258064 |
491 | 241081 |
510 | 260100 |
∑Xi _ | ∑X i 2 |
6027 | 3027615 |
- Стъпка 5: Формулата се използва за изчисляване на дисперсията:
Така дисперсията на пробата е приблизително S 2 = 50 kg 2 .
Изчисляване на стандартното отклонение на извадката (S)
Сега, когато имаме дисперсията, изчисляването на стандартното отклонение е толкова просто, колкото да извадим корен квадратен от първото:
Както може да се види, сравнението на стандартното отклонение, което е 7 килограма, със средното тегло на биковете, което е 502,25 килограма (изчислено отделно), ни позволява да заключим, че тази проба има ниска дисперсия, тъй като е само 1,4% от средното тегло на биковете.
Препратки
Espinoza, CI, & Echecopar, AL (2020). Статистически приложения, използващи MS Excel с примери стъпка по стъпка (испанско издание) (1-во издание ). Лима, Перу: Луис Фелипе Аризменди Ечекопар и Дуо Негосиос SAC.
Инвестопедия. (2021, 16 април). Научете как стандартното отклонение се определя чрез използване на дисперсия. Извлечено на 24 юли 2021 г. от https://www.investopedia.com/ask/answers/021215/what-difference-between-standard-deviation-and-variance.asp
Lopez, JF (18 ноември 2017 г.). Дисперсия . Извлечено от https://economipedia.com/definiciones/varianza.html
Национален институт по стандарти и технологии. (nd). Основни дефиниции на несигурността. Извлечено на 24 юли 2021 г. от https://physics.nist.gov/cuu/Uncertainty/basic.html
Уебстър, А. (2001). Статистика, приложена към бизнеса и икономиката (испанско издание) . Торонто, Канада: Irwin Professional Publishing.