В проучвания, които използват статистически инструменти, резултатите се представят, включително границата на грешка, която също се нарича доверителен интервал. Независимо от това дали се изследва мнението за продукти или по политически въпроси, проучвания, които са събрали данни в извадка от определена популация, показват като резултат определена стойност, обикновено в проценти, придружена от друга стойност, предшествана от символа +/- . Тази втора стойност е грешката и определя, заедно със стойността, измерена в извадката, обхвата от стойности, в които се очаква да варира истинската стойност, изследвана в популацията; долната стойност на този диапазон е измерената стойност минус грешката, докато горната стойност е измерената стойност плюс грешката.
Нека разгледаме общия случай на проста извадка, избрана на случаен принцип от достатъчно голяма популация. Пример може да бъде изследване на съотношението на населението на даден град, което консумира определен продукт; За тази цел се консултира група, съставена от много хора от този град, избрани на случаен принцип, ако консумират посочения продукт.
Първото решение, което трябва да се вземе, е нивото на увереност, с което трябва да се определи границата на грешка. Нивото на достоверност се определя като процент, който искаме да вземем предвид в областта на стандартното нормално разпределение, което е вероятностното разпределение, че събитията следват при споменатите условия. Както е показано на фигурата по-долу, площта определя стойността на z α/2 ; колкото по-голяма е площта, толкова по-високо е нивото на доверие в границата на грешка, която се разглежда.
Следващата таблица показва стойностите на параметъра z α/2 за различните стойности на нивото на достоверност, които изразяват площта на нормалното разпределение, която трябва да бъде покрита, изразена като процент от общата площ.
След като нивото на достоверност е определено, границата на грешка се изчислява като
e = z α/2 /( 2√n )
където n е броят на случаите, които съставляват анализираната проба. При прилагането на тази формула е ясно, че колкото по-голям е размерът на извадката, която изследваме, толкова по-малка е границата на грешка.
В предишния пример, ако групата от консултирани хора е съставена от 900 лица и се желае граница на грешка с ниво на достоверност от 95%, тогава стойността на z α/2 е 1,96; От прилагането на формулата се получава, че e = 0,0327, което изразено в проценти е 3,27%. Ако резултатът от проучването е, че половината от консултираните хора консумират продукта, тоест стойността v = 50%, резултатът от проучването ще бъде V = 50 +/- 3%, приблизително марж от 3%. грешка. Изразено по друг начин, данните, които трябва да бъдат получени, ще бъдат между стойностите 47 и 53%, с ниво на достоверност 95%.
Източници
Настроение, Александър; Грейбил, Франклин А.; Boes, Duane C. Въведение в теорията на статистиката . Трето издание, McGraw-Hill, 1974 г.
Тест на хипотезата . Статистически извод. Национален автономен университет на Мексико. Достъп през октомври 2021 г.
Westfall, Peter H. Разбиране на съвременните статистически методи . Бока Ратон, Флорида: CRC Press, 2013 г.