Konfidenciaintervallumok két populációs arány különbségére

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.

A megbízhatósági intervallumokat (CI) a következtetési statisztikákban egy populációs paraméter értékének becslésére szolgáló eszközként használják. Ezek nagyobb mennyiségű információt adnak egy paraméter valódi értékéről, mint a pontbecslők, mivel véges szélességű értékek intervallumát képviselik, amelyen belül bizonyos fokú biztonsággal megvan a paraméter valódi értéke. Ez utóbbi olyan dolog, amit a pontbecslések nem biztosítanak.

Konfidencia intervallumok két populációra

Amikor két különböző populáció összehasonlítására vagyunk kíváncsiak, gyakran az érdekel bennünket, hogy az egyik paramétere nagyobb-e, kisebb-e vagy egyenlő-e a másik megfelelő paraméterével. Például két villanymotor teljesítményének összehasonlításakor érdekelhet bennünket annak meghatározása, hogy az A motor nyomatéka nagyobb-e, mint a B motoré. Ebben az esetben két populációs átlagot hasonlítunk össze.

Sokszor azonban nem egy paraméter átlagértékeinek összehasonlítása érdekel bennünket, hanem egy adott feltételnek megfelelő vagy nem teljesítő populáció aránya . Ebben az esetben egy konfidenciaintervallum felállítása a két populációs arány különbségének becslésére.

Következtetések két népességarány P 1 -P 2 különbségére

Sok különböző helyzet van, amikor két népességarány közötti különbség érdekelhet bennünket. Mint korábban említettük, ez a különbség lehetővé teszi, hogy összehasonlítsuk az egyenértékű arányokat két különböző populációban. Az alábbiakban bemutatunk néhány példát azokra a kutatási problémákra, amelyek megkövetelik a két népességarány közötti különbség konfidenciaintervallumának meghatározását :

  • Egy új gyógyászati ​​kezelés klinikai vizsgálatai során különösen fontos összehasonlítani azon egyének arányát, akiknél javult az egészségi állapotuk a kezelésben részesült populációban, és a csak placebót kapó egyének csoportjában.
  • Amikor össze akarjuk hasonlítani azon nők és férfiak arányát, akik egyetértenek vagy nem értenek egyet egy bizonyos kormányzati intézkedéssel.
  • Az üzleti életben gyakran érdekel bennünket a gyártási folyamat minőségének összehasonlítása két különböző gyártósoron. Ebben az esetben összehasonlítható a mindkét gyártósoron egy adott időszakban előállított hibás vagy nem megfelelő cikkek aránya.
  • A mikrobiológia területén érdekelhet bennünket a különböző kémiai fertőtlenítőszerekkel való kezelés után fennmaradó baktériumkolóniák arányának összehasonlítása.
  • A marketingszakemberek gyakran végeznek A/B-teszteket, hogy meghatározzák, hogy egy weboldal mely tartalma a leghatékonyabb a potenciális ügyfelek vásárlókká történő alakításában. Ennek érdekében a webhelyet felkeresők fele tartalmat (A), a másik felének pedig alternatív tartalmat (B) jelenít meg, hogy összehasonlítsa azon látogatók arányát, akik valóban megvásárolták a javasolt terméket vagy szolgáltatást.

P 1 és P 2 összehasonlításából a P 1 – P 2 különbséghez

Számos példa van még olyan helyzetekre, amelyekben érdekelhet bennünket két különböző populáció arányának összehasonlítása. Ez az összehasonlítás többféleképpen is elvégezhető. Például érdemes tudni, ha:

  • Mindkét arány egyenlő (P 1 = P 2 )
  • Az 1. arány nagyobb, mint a 2. arány (P 1 > P 2 )
  • Az 1. arány kisebb, mint a 2. arány (P 1 < P 2 )

Ezen esetek bármelyikében ezek az állítások átírhatók az arányok közötti különbség szempontjából:

  • Ha kíváncsiak vagyunk arra, hogy P 1 = P 2 , akkor ez megegyezik annak meghatározásával, hogy P 1 – P 2 = 0
  • Ha kíváncsiak vagyunk arra, hogy P 1 > P 2 , akkor ez megegyezik annak meghatározásával, hogy P 1 – P 2 > 0
  • Ha kíváncsiak vagyunk arra, hogy P 1 < P 2 , akkor ez megegyezik annak meghatározásával, hogy P 1 – P 2 < 0

Ezért a népességarányok bármilyen összehasonlítása megoldható úgy, hogy megtaláljuk a népességarányok közötti különbség konfidencia intervallumát, majd elvégezzük az eredmény megfelelő elemzését.

De hogyan jönnek létre ezek a konfidenciaintervallumok?

Ezt az egyes sokaságokból származó minták elemzésével és a következtetési statisztika eszközeivel érik el. Ez az eljárás attól függ, hogy nagy vagy kis mintákkal dolgozunk.

Konfidenciaintervallum Két populációarány különbségének becslése nagy mintákból (n ≥ 30)

A populációs arányok különbségére vonatkozó konfidenciaintervallum megoldható a populáció binomiális arányának konfidenciaintervallumának kiterjesztéseként. Binomiális arányok esetén (azaz a kísérlet vagy megfigyelés eredménye sikeres vagy kudarc, és P a siker valószínűségét jelenti), az arány eloszlása ​​egy nagy mintában (p ) megközelítőleg normális eloszlást követ átlaggal . P (a populáció aránya) és P(1 – P)/n variancia, mindaddig, amíg a siker valószínűsége nem túl magas vagy túl alacsony (azaz nem esik túl közel 1-hez vagy 0-hoz).

Két populációs arány különbsége, P 1 – P 2 esetén, két független, p 1 és p 2 arányú mintából állapíthatjuk meg a konfidenciaintervallum határait . Ha ezek a minták megfelelnek a fenti feltételeknek (az n 1 és n 2 minták nagyok, a p 1 és p 2 arányok távol vannak 1-től és 0-tól), és ezért normális eloszlást követnek, akkor a különbség is egy normál eloszlást követ, átlagos P 1 értékkel – P 2 és variancia p 1 (1 – p 1 )/n 1 + p 2(1 – p 2 )/n 2 .

Ezen eredmények ismeretében a nagy mintákból kapott két populációs arány különbségének konfidenciaintervallumát 100(1 – α)%-os konfidenciaszinttel, ahol α jelenti a szignifikancia szintet, a következőképpen adjuk meg:

Konfidenciaintervallumok két populációs arány különbségére

A fenti képletben Z α/2 Z értékének felel meg a normál normál eloszlásban, amely α/2 területet hagy tőle jobbra.

Konfidenciaintervallum két populációarány különbségéhez kis mintákhoz képest (n < 30)

Ha bármelyik minta mérete kisebb, mint 30, vagy ha bármelyik arány nagyon közel van a 0-hoz vagy az 1-hez, akkor az eloszlása ​​nem tudja megfelelően megközelíteni a normál eloszlást. Ebben az esetben a két arány különbsége sem fog normális eloszlást követni, ezért a fenti képlet a konfidenciaintervallumra nem érvényes.

A népességarányok különbségére a kis mintákon alapuló következtetés meglehetősen összetett, és túlmutat e cikk keretein.

Két populációs arány különbségének konfidenciaintervallumának értelmezése

A két populációs arány különbségére vonatkozó konfidenciaintervallum kiszámítása után a kapott eredményt értelmezni kell. Három eltérően értelmezett eredmény adható meg.

Tekintsünk minden olyan esetet, amikor egy konfidenciaintervallumot 100(1 – α)%-os konfidenciaszinttel vagy egyszerűen α szignifikanciaszinttel kapunk, amelynek alsó és felső határa LI, illetve LS. Vagyis:

Konfidenciaintervallumok két populációs arány különbségére

A kapott határértékek előjelétől függően eltérő következtetésekre juthatunk a két népességarány különbségére vonatkozóan:

  • Ha az alsó és a felső határ is negatív, akkor 100(1 – α)%-os konfidenciaszinttel azt mondhatjuk, hogy a 2. sokaság aránya nagyobb, mint az 1. sokaság megfelelő aránya. hogy P 1 < P 2 vagy hogy P 2 > P 1 .
  • Ha az alsó határ negatív, a felső határ pedig pozitív, és ezért a konfidenciaintervallum nullát tartalmaz, akkor 100(1 – α)%-os konfidenciaszinttel azt mondhatjuk, hogy nincs különbség a két népességarány között. . Vagyis arra a következtetésre jutunk, hogy P 1 = P 2 .
  • Végül, ha mind az alsó, mind a felső határ pozitív, akkor 100(1 – α)%-os konfidenciaszinttel azt mondhatjuk, hogy az 1. sokaság aránya nagyobb, mint a megfelelő 2. sokaság aránya. P 1 > P 2 .

Példa két populációs arány konfidenciaintervallumának kiszámítására

nyilatkozat

Tegyük fel, hogy 250 mexikói mérnökhallgatóból álló véletlenszerű mintán végeztek egy felmérést, hogy megtudják, milyen arányban sajátítják el a konfidenciaintervallum fogalmát. A felmérés eredményei azt mutatták, hogy 64,8%-uk nem uralja, míg a többiek igen. Másrészt ugyanezt a felmérést 180 spanyol mérnökhallgatóból álló mintán végezték el, amelyre 54 hallgató azt válaszolta, hogy elsajátította a konfidenciaintervallum fogalmát.

Van-e különbség azon spanyol és mexikói diákok aránya között, akik elsajátítják a konfidenciaintervallum fogalmát, 0,05-ös szignifikanciaszinten?

Megoldás

Ahogy a kérdésből láthatjuk, azt szeretnénk meghatározni, hogy van-e különbség két különböző populáció arányai között. Az érdeklődés aránya azon hallgatók arányából adódik, akik elsajátítják a konfidenciaintervallum fogalmát, így ebben az esetben a felmérésre adott igenlő válasz a binomiális kísérlet szempontjából sikert jelent.

A mexikói hallgatók körében a minta 250 diák volt, és azt jelzik, hogy a tárgyat nem sajátító hallgatók aránya 64,8%. De nem ezt az arányt szeretnénk, hiszen a tárgy el nem sajátítása kudarc. Ezért ez az arány megfelel a q komplementernek . Ennek fényében a sikeresek aránya, p, a mexikói diákok mintájában:

Konfidenciaintervallumok két populációs arány különbségére

Ezzel szemben a spanyol diákok mintájánál megvan a sikeresek száma és a minta teljes nagysága, így a sikeresek aránya a következő lesz:

Konfidenciaintervallumok két populációs arány különbségére

Ezeket az eredményeket az alábbi táblázat foglalja össze.

mexikói diákok spanyol diákok
n MEX = 250 nESP = 180
p MEX = 0,352 p ESP = 0,300

Amint látjuk, mindkét mintaméret jóval nagyobb, mint 30, ezért nagy mintának számítanak. Ráadásul sem a mexikói, sem a spanyol diákok aránya nem közelíti meg lényegesen a 0-t vagy az 1-et. Végül annak ellenére, hogy az állítás ezt nem határozza meg, feltételezhetjük, hogy mindkét minta független egymástól.

Ilyen körülmények között azt mondhatjuk, hogy mind a két populáció mintaaránya, mind a mintaarányok különbsége normális eloszlást fog követni. Ezért az előző egyenlet segítségével meghatározhatjuk a konfidencia intervallumot, amely a következő lesz:

Konfidenciaintervallumok két populációs arány különbségére

Vegyük észre, hogy a konfidenciaintervallum megállapításához szükségünk van a Z értékére az adott szignifikanciaszint felénél, ami ebben az esetben α = 0,05. Vagyis meg kell találnunk a Z α/2 = Z 0,05/2 = Z 0,025 értéket . Ez az érték megtalálható egy szabványos normál eloszlási táblázatban, egy mobil statisztikai alkalmazás vagy egy táblázat használatával, például Excel for Windows vagy Numbers for MacOS használatával.

Ebben az esetben Z 0,025 = 1,959964. Tehát a konfidencia intervallum a következő lesz:

Konfidenciaintervallumok két populációs arány különbségére

Konfidenciaintervallumok két populációs arány különbségére

Konfidenciaintervallumok két populációs arány különbségére

Amint látjuk, az így számított konfidenciaintervallum nullát tartalmaz, ezért 95%-os konfidenciaszinttel arra a következtetésre jutunk, hogy nincs szignifikáns különbség az intervallum fogalmát elsajátító mexikói és spanyol diákok aránya között. Megbízható.

Hivatkozások

Cetinkaya-Rundel, M. (2012, március 13.). 14. előadás: Nagy- és kismintás következtetés az arányokhoz . Statisztikai Tanszék a Duke Egyetemen. https://www2.stat.duke.edu/courses/Spring12/sta101.1/lec/lec14S.pdf

del Rio, AQ (2019, szeptember 1.). 7.8. Konfidenciaintervallum az aránykülönbséghez. | Édesített alapstatisztika . Foglaljon le. https://bookdown.org/aquintela/EBE/privacy-interval-for-the-difference-of-proportions-.html

Holmes, A., Illowsky, B. és Dean, S. (2017, november 29.). 10.4 Két független népességarány összehasonlítása – Bevezető üzleti statisztikák . OpenStax. https://openstax.org/books/introductory-business-statistics/pages/10-4-comparing-two-independent-population-proportions

Icedo Félix, M. (2020, május 7.). RPubs – Konfidenciaintervallumok két populációs arány különbségéhez . RPubs. https://rpubs.com/Melanie_Icedo/Asignacion-6_Intervalo-confianza-proportion-poblacional

Statológusok. (nd). Az aránykülönbség konfidencia intervalluma . https://statologos.com/diferencia-de-intervalo-de-fianza-en-proportiones/

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados