Доверителни интервали за разликата на две пропорции на населението

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.

Доверителните интервали (CI) се използват в инференциалната статистика като инструмент за оценка на стойността на параметър на популацията. Те предоставят по-голямо количество информация за истинската стойност на даден параметър от точковите оценители, тъй като представляват интервал от стойности с крайна ширина, в рамките на който имаме определена степен на увереност, че ще лежи истинската стойност на параметъра. Последното е нещо, което точковите оценители не предоставят.

Доверителни интервали за две популации

Когато се интересуваме от сравняването на две различни съвкупности, често се интересуваме да разберем дали определен параметър на едната от тях е по-голям, по-малък или равен на съответния параметър на другата. Например, когато сравняваме производителността на два електродвигателя, може да ни е интересно да определим дали въртящият момент на мотор А е по-голям от този на мотор Б. В този случай ние сравняваме две средни стойности на популацията.

Много пъти обаче се интересуваме от сравняване не на средните стойности на даден параметър, а на съотношението на съвкупността , която отговаря или не на определено условие. В този случай това, което се иска, е да се установи доверителен интервал за оценка на стойността на разликата между две пропорции на населението.

Изводи за разликата на две пропорции на населението P 1 -P 2

Има много различни ситуации, в които може да се интересуваме от разликата между две пропорции на населението. Както споменахме преди, тази разлика ни позволява да сравним еквивалентни пропорции в две различни популации. Някои примери за изследователски проблеми, които изискват установяване на доверителен интервал за разликата между две пропорции на населението, са представени по-долу:

  • При клиничните изпитвания на ново медицинско лечение е от особено значение да се сравни делът на индивидите, които показват подобрение в медицинското си състояние в популацията, получаваща лечението, със същия дял в групата на индивидите, получаващи само плацебо.
  • Когато искаме да сравним дела на жените и мъжете, които са съгласни или не с определена държавна мярка.
  • В бизнеса често се интересуваме от сравняване на качеството на производствения процес в две различни производствени линии. В този случай пропорциите на дефектни или несъответстващи артикули, произведени от двете производствени линии за даден период от време, могат да бъдат сравнени.
  • В областта на микробиологията може да ни е интересно да сравним дела на бактериалните колонии, които оцеляват след третиране с различни химически дезинфектанти.
  • Маркетолозите често правят A/B тестове, за да определят какво съдържание на дадена уеб страница е най-ефективно за превръщането на потенциални клиенти в купувачи. За да направите това, на половината от хората, които влизат в уебсайта, се показва съдържание (A), а на другата половина се показва алтернативно съдържание (B), за да се сравнят пропорциите на посетителите, които действително са закупили предложения продукт или услуга.

От сравнението на P 1 и P 2 до разликата P 1 – P 2

Има още много примери за ситуации, в които може да ни е интересно да сравним пропорциите на две различни популации. Това сравнение може да се направи по различни начини. Например, може да искаме да знаем дали:

  • И двете пропорции са равни (P 1 = P 2 )
  • Пропорция 1 е по-голяма от пропорция 2 (P 1 > P 2 )
  • Пропорция 1 е по-малка от пропорция 2 (P 1 < P 2 )

Във всеки от тези случаи тези твърдения могат да бъдат пренаписани по отношение на разликата между пропорциите:

  • Ако се интересуваме да разберем дали P 1 = P 2 , това е еквивалентно на определянето дали P 1 – P 2 = 0
  • Ако се интересуваме да разберем дали P 1 > P 2 , това е еквивалентно на определянето дали P 1 – P 2 > 0
  • Ако се интересуваме да разберем дали P 1 < P 2 , това е еквивалентно на определяне дали P 1 – P 2 < 0

Следователно всяко сравнение между пропорциите на населението може да бъде решено чрез намиране на доверителен интервал за разликата между пропорциите на населението и след това извършване на подходящ анализ на резултата.

Но как се установяват тези доверителни интервали?

Това се постига чрез анализиране на извадки от всяка популация и използване на инструментите на инференциалната статистика. Тази процедура зависи от това дали работим с големи или малки проби.

Доверителен интервал Оценка на разликата на две пропорции на популацията от големи проби (n ≥ 30)

Доверителният интервал за разликата в пропорциите на популацията може да бъде решен като разширение на доверителния интервал за биномна пропорция в популация. В случай на биномиални пропорции (т.е. резултатът от експеримента или наблюдението е успех или неуспех и P представлява вероятността за успех), разпределението на пропорцията в голяма извадка ( p ) следва приблизително нормално разпределение със средна P (съотношение на популацията) и дисперсия P(1 – P)/n, стига вероятността за успех да не е твърде висока или твърде ниска (т.е. не е твърде близо до 1 или съответно 0).

В случай на разлика между две пропорции на популацията, P 1 – P 2 , можем да установим границите на доверителния интервал от две независими извадки с пропорции p 1 и p 2 . Ако тези проби отговарят на същите условия като по-горе (проби n 1 и n 2 големи и пропорции p 1 и p 2 далеч от 1 и 0) и следователно следват нормални разпределения, разликата също ще следва нормално разпределение със средно P 1 – P 2 и дисперсия p 1 (1 – p 1 )/n 1 + p 2(1 – p 2 )/n 2 .

Предвид тези резултати, доверителният интервал за разликата на две пропорции на популацията, получени от големи проби, с ниво на достоверност от 100(1 – α)%, където α представлява нивото на значимост, се дава от:

Доверителни интервали за разликата на две пропорции на населението

В горната формула Z α/2 съответства на стойността на Z в стандартното нормално разпределение, което оставя област от α/2 вдясно.

Доверителен интервал за разликата на две пропорции на популацията от малки проби (n < 30)

Ако някой от размерите на извадката е по-малък от 30 или ако някоя от пропорциите е много близка до 0 или 1, вашето разпределение не може да се приближи адекватно до нормално разпределение. В този случай разликата на двете пропорции също няма да следва нормално разпределение, поради което горната формула за доверителния интервал не е приложима.

Изводът за разликата в пропорциите на населението въз основа на малки извадки е значително сложен и е извън обхвата на тази статия.

Тълкуване на доверителния интервал за разликата на две пропорции на населението

След изчисляване на доверителния интервал за разликата на две пропорции на популацията, полученият резултат трябва да се интерпретира. Могат да бъдат дадени три резултата, които се интерпретират по различен начин.

Нека разгледаме всеки случай, при който се получава доверителен интервал с ниво на доверие от 100(1 – α)% или просто ниво на значимост α, чиито долна и горна граница са съответно LI и LS. Тоест:

Доверителни интервали за разликата на две пропорции на населението

В зависимост от знака на получените граници можем да стигнем до различни заключения относно разликата между двете пропорции на населението:

  • Ако и долната, и горната граница са отрицателни, тогава можем да кажем, с ниво на достоверност от 100(1 – α)%, че съотношението в популация 2 е по-голямо от съответното съотношение в популация 1. Тоест, можем да кажем че P 1 < P 2 или че P 2 > P 1 .
  • Ако долната граница е отрицателна, а горната граница е положителна и следователно доверителният интервал съдържа нула, тогава можем да кажем, с ниво на увереност от 100(1 – α)%, че няма разлика между двете. . Тоест се прави заключението, че P 1 = P 2 .
  • И накрая, ако и долната, и горната граница са положителни, тогава можем да кажем, с ниво на достоверност от 100(1 – α)%, че пропорцията на популация 1 е по-голяма от съответната пропорция на популация 2. Тоест, заключаваме, че P 1 > P 2 .

Пример за изчисляване на доверителния интервал за две пропорции на населението

изявление

Да предположим, че е проведено проучване върху произволна извадка от 250 мексикански студенти по инженерство, за да се установи каква част от тях са усвоили концепцията за доверителни интервали. Резултатите от проучването показаха, че 64,8% от тях не го доминират, докато останалите го правят. От друга страна, същото проучване беше проведено върху извадка от 180 испански студенти по инженерство, на които 54 студенти отговориха, че са усвоили концепцията за доверителни интервали.

Има ли разлика между пропорциите на испанските и мексиканските студенти, които владеят концепцията за доверителни интервали, при ниво на значимост от 0,05?

Решение

Както можем да видим от въпроса, това, което искаме, е да определим дали има или не разлика между пропорциите на две различни популации. Делът на интереса се състои от дела на учениците, които овладяват концепцията за доверителни интервали, така че в този случай положителният отговор на анкетата представлява успех от гледна точка на биномния експеримент.

За популацията от мексикански студенти извадката е от 250 студенти и те показват, че делът на студентите, които не владеят въпросния предмет, е 64,8%. Но това не е пропорцията, която искаме, тъй като неусвояването на темата е провал. Следователно тази пропорция съответства на допълнението q . С оглед на това делът на успехите, p, за извадката от мексикански студенти е:

Доверителни интервали за разликата на две пропорции на населението

От друга страна, в случая с извадката от испански студенти, имаме броя на успехите и общия размер на извадката, така че делът на успехите ще бъде:

Доверителни интервали за разликата на две пропорции на населението

Тези резултати са обобщени в следващата таблица.

мексикански студенти Испански студенти
n MEX = 250 nESP = 180
p MEX = 0,352 p ESP = 0,300

Както виждаме, и двата размера на извадката са значително по-големи от 30, така че се считат за големи извадки. В допълнение, нито делът на мексиканските студенти, нито този на испанските студенти е значително близо до 0 или 1. И накрая, въпреки факта, че твърдението не го уточнява, можем да приемем, че и двете проби са независими една от друга.

При тези условия можем да кажем, че както пропорциите на извадката на двете популации, така и разликата в пропорциите на извадката ще следват нормално разпределение. Следователно можем да използваме предишното уравнение, за да определим доверителния интервал, който ще бъде:

Доверителни интервали за разликата на две пропорции на населението

Обърнете внимание, че за да установим доверителния интервал, се нуждаем от стойността на Z за половината от даденото ниво на значимост, което в този случай е α = 0,05. Тоест трябва да намерим Z α/2 = Z 0,05/2 = Z 0,025 . Тази стойност може да бъде намерена в стандартна таблица за нормално разпределение, като се използва мобилно приложение за статистика или електронна таблица като Excel за Windows или Numbers за MacOS.

В този случай Z 0,025 = 1,959964. И така, доверителният интервал ще бъде:

Доверителни интервали за разликата на две пропорции на населението

Доверителни интервали за разликата на две пропорции на населението

Доверителни интервали за разликата на две пропорции на населението

Както виждаме, изчисленият по този начин доверителен интервал съдържа нула, поради което се заключава с ниво на доверие от 95%, че няма значителна разлика между пропорциите на мексиканските и испанските студенти, които овладяват концепцията за интервали , доверен.

Препратки

Cetinkaya-Rundel, M. (2012, март 13). Лекция 14: Големи и малки примерни изводи за пропорции . Департамент по статистически науки в университета Дюк. https://www2.stat.duke.edu/courses/Spring12/sta101.1/lec/lec14S.pdf

дел Рио, AQ (2019 г., 1 септември). 7.8 Доверителен интервал за разликата в пропорциите. | Подсладена основна статистика . Резервирайте надолу. https://bookdown.org/aquintela/EBE/confidence-interval-for-the-difference-of-proportions-.html

Холмс, А., Иловски, Б. и Дийн, С. (2017 г., 29 ноември). 10.4 Сравняване на две независими пропорции на населението – въвеждаща бизнес статистика . OpenStax. https://openstax.org/books/introductory-business-statistics/pages/10-4-comparing-two-independent-population-proportions

Icedo Félix, M. (2020 г., 7 май). RPubs – Доверителни интервали за разликата на две пропорции на населението . RPubs. https://rpubs.com/Melanie_Icedo/Asignacion-6_Intervalo-confianza-proportion-poblacional

Статолози. (nd). Доверителен интервал за разликата в пропорциите . https://statologos.com/diferencia-de-intervalo-de-fianza-en-proportiones/

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados