카이제곱, 카이제곱 또는 χ2 테이블로 임계값 결정

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.

개인용 컴퓨터가 등장하기 전, 스마트폰이 등장하기 오래 전부터 일부 수학 함수의 수치 계산은 수작업으로 이루어져야 했으며 이는 매우 복잡했습니다. 그러나 이러한 계산 결과는 통계와 같은 다양한 응용 분야에서도 매우 중요했습니다. 이 문제에 대한 해결책은 일부 수학자들이 계산을 수행하고 결과가 필요할 때 참조로 사용하기 위해 표로 구성하는 데 전념했다는 것입니다.

이에 대한 몇 가지 예로는 삼각 함수 테이블(예: 사인, 코사인 및 탄젠트), 로그 테이블 및 카이 제곱 테이블이 일부인 통계 테이블이 있습니다. 오늘날 우리는 Excel, Google Sheets, Mathematica, Minitab 및 R과 같은 고급 계산 프로그램을 사용하여 몇 초 만에 모든 계산을 수행할 수 있음에도 불구하고 여전히 통계표를 사용해야 합니다. , 특히 이러한 프로그램이 수행하는 작업을 더 잘 이해하기 위해.

위와 같이 주어진 자유도와 유의 수준에서 이 분포의 임계값을 찾는 데 카이제곱 테이블을 사용하는 방법을 살펴보겠습니다.

카이 제곱 분포(χ ν ²)란 무엇입니까?

카이 제곱 분포 (그리스 문자 chi, χ에서 제곱, 즉 χ²로 올려짐)는 두 개의 정규 랜덤 변수 (표준 정규 분포를 따르는) 의 제곱의 합을 갖는 확률의 통계적 분포입니다. ) 서로 독립적입니다.

즉, 다음과 같이 정의되는 확률 변수 X가 갖는 분포입니다.

카이 제곱, 카이 제곱 또는 χ2 분포에서 무작위 변수 정의

여기서 합계는 표준 정규 분포를 따르는 ν 독립 변수 Z i 에 대해 이루어집니다 (즉, Z  ̴ N(0,1)이 주어진 경우). X를 구성하는 독립 변수 의 수 ν를 X의 자유도라고 합니다.

1900년에 Pearson은 이 랜덤 변수가 다음 확률 밀도 함수로 정의된 확률 분포를 따른다는 것을 수학적으로 증명했습니다.

카이제곱, 카이제곱 또는 χ2 분포의 확률 분포

여기서 ν는 자유도, Γ는 감마 분포 함수, e 는 오일러 상수입니다.

자유도에 따라 이 분포 곡선의 모양이 다를 수 있습니다.

카이 제곱 분포;  다양한 자유도에 대한 확률 밀도 k.
서로 다른 자유도 k를 갖는 카이제곱 분포에 대한 확률 밀도 의 서로 다른 형태 .

대부분의 실제 사례에는 2개 이상의 자유도가 있으며 이 분포 곡선의 그래프는 항상 0에서 시작하여 빠르게 증가한 다음 천천히 감소하여 오른쪽으로 무한히 긴 꼬리를 나타냅니다.

서로 다른 자유도 data-lazy-src=통계에서 중요한 값은 무엇입니까?

임계 값은 위 또는 아래 확률 곡선의 주어진 영역을 떠나는 임의 변수의 특정 값입니다. 예를 들어, 임계 값은 위의 확률 밀도 곡선 영역의 5%를 남기거나, 동일한 값 아래의 영역의 95%를 남기는 임의 변수 X의 값을 나타낼 수 있습니다.

즉, 임계값을 정의하기 위해서는 반드시 확률변수의 확률밀도함수를 완전히 알아야 하고(즉, 확률분포를 알아야 함) 관심 있는 확률값을 정의해야 합니다.

예를 들어 확률변수 X의 임계값을 X<xc일 확률이 확률값 p와 같은 특정값 xc로 정의 수 있다 . 즉, 이 경우 확률 p에 대한 임계값 x c는 다음 식을 만족하는 값이 됩니다.

카이제곱, 카이제곱 또는 χ2 테이블로 임계값 결정

이것은 또한 종종 X > x c 일 확률로 작성됩니다 . p의 보수인 이 확률은 그리스 문자 α로 표시되며 일부 응용 프로그램에서는 유의 수준이라고 합니다. p의 보수이기 때문에 α = 1 – p가 참입니다.

수학적 관점에서 볼 때 임계값은 일반적으로 누적 확률 분포 함수(F (X) ) 로 정의됩니다 . 이는 확률 밀도 곡선 아래의 영역을 나타내기 때문입니다. 일반적으로 임계값 x c는 다음을 충족하는 값입니다.

카이제곱, 카이제곱 또는 χ2 테이블로 임계값 결정

또는 중요성 측면에서 다음을 충족하는 것입니다.

카이제곱, 카이제곱 또는 χ2 테이블로 임계값 결정

무작위 변수의 분포에 따라 하한은 0이 되거나 하한이 없을 수 있습니다(위에 표시된 방정식에서와 같이).

임계값이라고 하는 이유는 무엇입니까?

이 값은 가설 검정 시 검정 통계량이 허용 영역에 속하는지 여부를 결정하거나 신뢰 구간의 한계를 결정하는 한계로 자주 사용되기 때문에 임계값이라고 합니다.

카이 제곱 분포의 임계값

이전 정의를 기반으로 이제 자유도가 ν인 카이제곱 분포를 따르는 임의 변수의 임계값을 다음 방정식을 만족하는 해당 변수 의 값(x c )으로 정의할 수 있습니다.

카이제곱, 카이제곱 또는 χ2 테이블로 임계값 결정

이는 다음 그래프를 통해 보다 쉽게 ​​확인할 수 있습니다.

카이제곱, 카이제곱 또는 χ2 테이블이 있는 임계값

이 이미지에서 볼 수 있듯이 임계값은 곡선 아래 영역을 두 부분으로 나누는 x축의 값(임의 변수 X의 가능한 값을 나타냄)에 해당합니다. X < x c 의 확률 및 uqe X > x c 또는 1 – P(X < x c ) 의 확률을 나타내는 분홍색 영역 .

카이 스퀘어 테이블이란 무엇이며 어떤 용도로 사용됩니까?

수학적 정의에서 알 수 있듯이 임계값 계산에는 매우 복잡한 함수를 통합한 다음 x c 값을 분리하는 작업이 포함됩니다 . 이는 분석적 관점에서 해결하기에는 지나치게 복잡합니다(사실상 거의 불가능함). 따라서 이를 대신하여 서로 다른 누적 확률 값을 생성하는 x 값을 하나씩 결정할 수 있는 방정식의 수치 적분 및 해결 방법을 사용하는 것입니다.

카이 제곱 표는 서로 다른 카이 제곱 분포 함수(자유도로 정의됨) 및 p, α 또는 둘 다의 서로 다른 값에 대한 이러한 값의 모음 에 해당합니다 .

다음은 카이 제곱 분포, 단측 및 양측 통계 테스트에서 가장 일반적으로 사용되는 값 및 신뢰 구간을 설정하기 위한 임계 값의 일반적인 표의 예입니다.

0,005 _ _ 0 , 01 0,025 _ _ 0.05 _ _ 0 , 1 0.90_ _ _ 0.95 _ _ 0,975_ _ _ 0.99 _ _ 0,995_ _ _
α → 0,995_ _ _ 0.99 _ _ 0,975_ _ _ 0.95 _ _ 0.90_ _ _ 0 , 10 0.05 _ _ 0,025 _ _ 0 , 01 0,005 _ _
ν                    
1 0,000 0,000 0.001 0.004 0.016 2,706 3,841 5,024 6,635 7,879
2 0.010 0.020 0.051 0.103 0.211 4,605 5,991 7,378 9,210 10,597
0.072 0.115 0.216 0.352 0.584 6,251 7,815 9,348 11,345 12,838
4 0.207 0.297 0.484 0.711 1,064 7,779 9,488 11,143 13,277 14,860
5 0.412 0.554 0.831 1,145 1,610 9,236 11,070 12,833 15,086 16,750
6 0.676 0.872 1,237 1,635 2,204 10,645 12,592 14,449 16,812 18,548
7 0.989 1,239 1,690 2,167 2,833 12,017 14,067 16,013 18,475 20,278
8 1,344 1,646 2,180 2,733 3,490 13,362 15,507 17,535 20,090 21,955
9 1,735 2,088 2,700 3,325 4,168 14,684 16,919 19,023 21,666 23,589
10 2,156 2,558 3,247 3,940 4,865 15,987 18,307 20,483 23,209 25,188
열하나 2,603 3,053 3,816 4,575 5,578 17,275 19,675 21,920 24,725 26,757
12 3,074 3,571 4,404 5,226 6,304 18,549 21,026 23,337 26,217 28,300
13 3,565 4,107 5,009 5,892 7,042 19,812 22,362 24,736 27,688 29,819
14 4,075 4,660 5,629 6,571 7,790 21,064 23,685 26,119 29,141 31,319
열 다섯 4,601 5,229 6,262 7,261 8,547 22,307 24,996 27,488 30,578 32,801
16 5,142 5,812 6,908 7,962 9,312 23,542 26,296 28,845 32,000 34,267
17 5,697 6,408 7,564 8,672 10,085 24,769 27,587 30,191 33,409 35,718
18 6,265 7,015 8,231 9,390 10,865 25,989 28,869 31,526 34,805 37,156
19 6,844 7,633 8,907 10,117 11,651 27,204 30,144 32,852 36,191 38,582
이십 7,434 8,260 9,591 10,851 12,443 28,412 31,410 34,170 37,566 39,997
이십 일 8,034 8,897 10,283 11,591 13,240 29,615 32,671 35,479 38,932 41,401
22 8,643 9,542 10,982 12,338 14,041 30,813 33,924 36,781 40,289 42,796
23 9,260 10,196 11,689 13,091 14,848 32,007 35,172 38,076 41,638 44,181
24 9,886 10,856 12,401 13,848 15,659 33,196 36,415 39,364 42,980 45,559
25 10,520 11,524 13,120 14,611 16,473 34,382 37,652 40,646 44,314 46,928
26 11,160 12,198 13,844 15,379 17,292 35,563 38,885 41,923 45,642 48,290
27 11,808 12,879 14,573 16,151 18,114 36,741 40,113 43,195 46,963 49,645
28 12,461 13,565 15,308 16,928 18,939 37,916 41,337 44,461 48,278 50,993
29 13,121 14,256 16,047 17,708 19,768 39,087 42,557 45,722 49,588 52,336
30 13,787 14,953 16,791 18,493 20,599 40,256 43,773 46,979 50,892 53,672
31 14,458 15,655 17,539 19,281 21,434 41,422 44,985 48,232 52,191 55,003
32 15,134 16,362 18,291 20,072 22,271 42,585 46,194 49,480 53,486 56,328
33 15,815 17,074 19,047 20,867 23,110 43,745 47,400 50,725 54,776 57,648
3. 4 16,501 17,789 19,806 21,664 23,952 44,903 48,602 51,966 56,061 58,964
35 17,192 18,509 20,569 22,465 24,797 46,059 49,802 53,203 57,342 60,275
36 17,887 19,233 21,336 23,269 25,643 47,212 50,998 54,437 58,619 61,581
37 18,586 19,960 22,106 24,075 26,492 48,363 52,192 55,668 59,893 62,883
38 19,289 20,691 22,878 24,884 27,343 49,513 53,384 56,896 61,162 64,181
39 19,996 21,426 23,654 25,695 28,196 50,660 54,572 58,120 62,428 65,476
40 20,707 22,164 24,433 26,509 29,051 51,805 55,758 59,342 63,691 66,766
오십 27,991 29,707 32,357 34,764 37,689 63,167 67,505 71,420 76,154 79,490
75 47,206 49,475 52,942 56,054 59,795 91,061 96,217 100,839 106,393 110,286
100 67,328 70,065 74,222 77,929 82,358 118,498 124,342 129,561 135,807 140,169

χ ν ² 표 에서 임계 값 결정

카이제곱표의 사용법은 매우 간단하다. 프로세스는 자유도 분석, 임계값을 얻고자 하는 통계 테스트 유형 및 테스트의 유의 수준으로 시작됩니다.

자유도

먼저 랜덤 변수를 따르는 특정 카이제곱 함수를 결정해야 합니다. 즉, 자유도를 결정해야 합니다. 이는 자유도가 통계량 을 구성하기 위해 추가되는 독립 정규 변수 의 수에 해당하기 때문에 검정 통계량을 잘 알고 있음을 의미합니다 .

수행하는 테스트 유형에 따라 자유도가 다르게 계산됩니다. 다음 표는 세 ​​가지 일반적인 시나리오에서 결정되는 방법을 보여줍니다.

테스트 유형 자유도(ν)
적합도 테스트 ν = n – 1(여기서 n은 모델 결과의 수)
모집단 분산에 대한 신뢰 구간(s 2 ) ν = n – 1(여기서 n은 샘플 크기임)
두 범주형 변수의 독립성 검정 ν = ( r – 1 )( c – 1) (여기서 r과 c는 분할표의 행과 열의 수임)

자유도의 수는 관심 있는 임계 값을 찾을 카이 제곱 표의 행을 결정합니다. 표에는 자유도에 대한 모든 값이 포함되어 있지 않을 수 있습니다. 자유도가 표시되지 않는 경우 세 가지 경로를 사용할 수 있습니다.

  1. 그것이 있는 더 완전한 테이블을 찾으십시오.
  2. 직전 행을 사용합니다.
  3. 이전 행과 다음 행 사이의 값을 보간합니다.

테스트 유형

자유도를 설정한 후 생성하는 것이 신뢰 구간인지 아니면 가설 검정을 수행하는지 설정해야 합니다. 후자의 경우 단측 검정인지 양측 검정인지도 확인해야 합니다. 이는 다음 단계와 관련이 있습니다.

유의 수준

신뢰 구간과 가설 검정 모두 관련 유의 수준이 있으며, 이는 제1종 오류를 범할 확률을 나타내며, 이는 귀무 가설 이 참일 때 기각할 확률을 나타냅니다. 제1종 오류는 일반적으로 가설을 검정할 때 발생할 수 있는 최악의 오류 중 하나로 간주되므로 많은 테스트가 이러한 유형의 오류를 범할 확률에 따라 정의됩니다.

중요성 수준은 과학적 연구를 시작할 때부터 연구자가 설정합니다. 그 또는 그녀는 자신의 가설을 테스트하여 그들이 얼마나 많은 틀릴 위험을 감수하고 싶은지 정의합니다. 마찬가지로 신뢰 구간을 설정할 때 유의 수준은 특정 값과 모집단 평균의 차이가 변수의 무작위 변동으로 인한 것이지 그 값이 실제로 다르다는 확률과 관련이 없습니다. .

카이 제곱표에서 다양한 유의 수준에 대한 임계값을 찾을 수 있습니다. 그러나 이 값은 가설 검정이 단측인 경우에만 직접 사용할 수 있습니다.

양측 가설 테스트이거나 신뢰 구간을 설정하는 경우 오류 확률은 분포의 양쪽에 균등하게 분포됩니다. 즉, 이러한 경우 테이블에서 두 개의 임계 값을 찾아야 하며 둘 다 테스트의 전체 유의 수준의 절반에 해당하는 유의 수준에 해당합니다.

표본 크기가 25이고 유의 수준이 5%인 모집단 분산에 대한 양측 가설 검정을 수행하는 경우 자유도가 25 – 1 = 24인 두 개의 중요한 카이 제곱 값을 결정해야 합니다. 및 /2=0.05/2 = 0.025.

오른쪽 꼬리의 임계값은 α = 0.025 값으로 구하지만 왼쪽 꼬리의 임계값은 보수 1 – α = 1 – 0.025 = 0.975로 구해야 합니다. 왼쪽으로 0.025 영역을 남기고, 이는 오른쪽으로 0.975 영역을 남기는 값을 말하는 것과 같습니다. 대안으로(그리고 더 실질적으로), 왼쪽 꼬리에 대해 대신 p = 0.025의 값을 찾을 수 있습니다. 정의에 따라 p는 α의 보수이기 때문입니다. 이런 식으로 뺄셈을 수행할 필요는 없지만 첫 번째 행에서 p의 값을 찾습니다.

본 예에서 해당 임계값은 12,401 및 39,364입니다.

참조

애드인소프트. (일차). 통계 테스트란 무엇입니까? https://help.xlstat.com/es/6758-what-statistical-test

Holmes, A. (2015년 3월 31일). 연속확률밀도함수의 성질 – 사업통계 입문 . 보도 자료. https://opentextbc.ca/introbusinessstatopenstax/chapter/properties-of-continuous-probability-density-functions/

미니탭, LLC. (2022). 검정 통계량이란 무엇입니까? 미니탭. https://support.minitab.com/es-mx/minitab/19/help-and-how-to/statistics/basic-statistics/supporting-topics/basics/what-is-a-test-statistic/

Quevedo, F. (2011년 12월 1일). 카이제곱 검정 . 합니다. https://www.medwave.cl/link.cgi/Medwave/Series/MBE04/5266

Rodó, P. (2021년 7월 7일). 누적 확률 분포 . 이코노미피디아. https://economipedia.com/definiciones/distribucion-de-probabilidad-cumulada.html#:%7E:text=La%20distribuci%C3%B3n%20de%20probabilidad%20cumulada, lesser%20than %20%20a%20valor% 20콘크리토.

Ruiz Mitjana, L. (2022년 2월 15일). 카이 제곱( χ 2 ) 검정 : 그것이 무엇이며 통계에서 어떻게 사용되는지 . 심리학과 마음. https://psicologiaymente.com/miscelanea/prueba-chi-cuadrado

mm
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados