カイ 2 乗、カイ 2 乗、または χ2 テーブルを使用した臨界値の決定

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


パーソナル コンピューターが利用可能になる前、そしてスマートフォンが存在するずっと前に、一部の数学関数の数値計算は手作業で行う必要があり、これは非常に複雑でした。ただし、これらの計算結果は、統計などのさまざまなアプリケーションでも非常に重要でした。この問題の解決策は、一部の数学者が計算を実行し、それらを表にまとめて、結果が必要なときに参照として使用することに専念したことでした.

これらの例としては、三角関数 (サイン、コサイン、タンジェントなど) のテーブル、対数テーブル、およびカイ 2 乗テーブルを含む統計テーブルがあります。今日、Excel、Google Sheets、Mathematica、Minitab、R などの高度な計算プログラムがあり、すべての計算を数秒で実行できるという事実にもかかわらず、統計表の使用は依然として必要です。 、特にこれらのプログラムが何をしているかをよりよく理解するために。

上記を考慮して、自由度と有意水準を考慮して、カイ二乗表を使用してこの分布の臨界値を見つける方法を検討します。

カイ二乗分布 (χ ν ²) とは何ですか?

カイ 2 乗分布(ギリシャ文字のカイ、χ の 2 乗、つまり χ² に由来) は、 2 つの正規確率変数(標準の正規分布に従う)の 2 乗の合計を有する確率の統計的分布です。 ) であり、互いに独立しています。

つまり、確率変数 X の分布であり、次のように定義されます。

カイ二乗、カイ二乗、または χ2 分布からの確率変数の定義

合計は、標準正規分布に従う ν 独立変数 Z iで作成されます(つまり、Z  ̴ N(0,1) が与えられます)。X を構成する独立変数νの数は、X の自由度の数と呼ばれます。

1900 年、ピアソンは、この確率変数が次の確率密度関数によって定義される確率分布に従うことを数学的に証明しました。

カイ二乗、カイ二乗、または χ2 分布の確率分布

ここで、ν は自由度、Γ はガンマ分布関数、eはオイラー定数です。

自由度の数に応じて、この分布曲線はさまざまな形状になる可能性があります。

カイ二乗分布;  異なる自由度 k の確率密度。
自由度 k が異なるカイ 2 乗分布の 確率密度 のさまざまな形式。

実際のケースの大多数では、自由度が 2 を超えており、この分布曲線のグラフは常に 0 から始まり、急速に増加してからゆっくりと減衰し、右に無限に長い裾を示します。

さまざまな自由度 >2 に対するカイ 2 乗分布の確率密度の形状。

カイ二乗分布またはピアソン分布 (発明者にちなんで) と呼ばれることもありますが、これはガンマ分布の特殊なケースであり、推論統計で有意性の統計検定を実行し、間隔を確立するために広く使用されています。

統計における重要な値は何ですか?

臨界値は確率変数の特定の値であり、確率曲線の特定の領域をその上または下に残します。たとえば、臨界値は、確率密度曲線の領域の 5% を上に残す確率変数 X の値、または同じことですが、その値を下回る領域の 95% を表す可能性があります。

つまり、臨界値を定義するには、確率変数の確率密度関数を完全に知っている必要があり (つまり、その確率分布を知っている必要があります)、関心のある確率値を定義する必要があります。

たとえば、確率変数 X の臨界値として、 X < x cである確率が確率値 p に等しいような特定の値 x cを定義できます。つまり、この場合、確率 p の臨界値 x cは、次の式を満たすものになります。

カイ 2 乗、カイ 2 乗、または χ2 テーブルを使用した臨界値の決定

これは、X > x cである確率で表されることもよくあります。p の補数であるこの確率はギリシャ文字 α で表され、一部のアプリケーションでは有意水準と呼ばれます。p の補数であるため、α = 1 – p は真です。

数学的な観点から、臨界値は通常、累積確率分布関数 (F (X) ) の観点から定義されます。これは、確率密度曲線の下の領域を表すためです。一般的に、臨界値 x cは次を満たすものです。

カイ 2 乗、カイ 2 乗、または χ2 テーブルを使用した臨界値の決定

または、重要性に関しては、次の条件を満たすものです。

カイ 2 乗、カイ 2 乗、または χ2 テーブルを使用した臨界値の決定

確率変数の分布に応じて、下限は 0 になる場合と、下限がない場合があります (上記の式のように)。

なぜ臨界値と呼ばれるのですか?

これは臨界値と呼ばれます。この値は、仮説検定中に検定統計量が許容範囲内か範囲外かを判断するための限界として、または信頼区間の限界を決定するためによく使用されるためです。

カイ二乗分布の臨界値

前の定義に基づいて、次の方程式を満たす変数の値 (x c ) として、自由度 ν のカイ 2 乗分布に従う確率変数臨界値を定義できるようになりました。

カイ 2 乗、カイ 2 乗、または χ2 テーブルを使用した臨界値の決定

これは、次のグラフを使用すると、より簡単に確認できます。

カイ 2 乗、カイ 2 乗、または χ2 テーブルによる臨界値

この画像でわかるように、臨界値は、曲線の下の領域を 2 つの部分に分割する x 軸の値 (確率変数 X の可能な値を表す) に対応します。 X < x cの確率、および uqe X > x cの確率、つまり 1 – P(X < x c ) を表すピンク色の領域。

カイ二乗表とは何ですか? また、何に使用されますか?

数学的定義からわかるように、臨界値の計算には、非常に複雑な関数を積分して x cの値を分離することが含まれます。これは、分析の観点から解決するのが非常に複雑です (実際にはほとんど不可能です)。したがって、これの代わりに、累積確率の異なる値を生成するxの値を1つずつ決定できるようにする方程式の積分と解決の数値的方法を使用することが行われます。

カイ 2 乗テーブルは、さまざまなカイ 2 乗分布関数 (自由度によって定義される) および p、α、またはその両方のさまざまな値のこれらの値のコレクションに対応します

以下は、カイ二乗分布の臨界値、片側および両側統計検定で最も一般的に使用される値、および信頼区間を確立するための典型的な表の例です。

0,005 _ _ 0 , 01 0,025 _ _ 0.05 _ _ 0 , 1 0.90 _ _ 0.95 _ _ 0,975 _ _ 0.99 _ _ 0,995 _ _
α → 0,995 _ _ 0.99 _ _ 0,975 _ _ 0.95 _ _ 0.90 _ _ 0 , 10 0.05 _ _ 0,025 _ _ 0 , 01 0,005 _ _
ν                    
1 0,000 0,000 0.001 0.004 0.016 2,706 3,841 5,024 6,635 7,879
2 0.010 0.020 0.051 0.103 0.211 4,605 5,991 7,378 9,210 10,597
3 0.072 0.115 0.216 0.352 0.584 6,251 7,815 9,348 11,345 12,838
4 0.207 0.297 0.484 0.711 1,064 7,779 9,488 11,143 13,277 14,860
5 0.412 0.554 0.831 1,145 1,610 9,236 11,070 12,833 15,086 16,750
6 0.676 0.872 1,237 1,635 2,204 10,645 12,592 14,449 16,812 18,548
7 0.989 1,239 1,690 2,167 2,833 12,017 14,067 16,013 18,475 20,278
8 1,344 1,646 2,180 2,733 3,490 13,362 15,507 17,535 20,090 21,955
9 1,735 2,088 2,700 3,325 4,168 14,684 16,919 19,023 21,666 23,589
10 2,156 2,558 3,247 3,940 4,865 15,987 18,307 20,483 23,209 25,188
十一 2,603 3,053 3,816 4,575 5,578 17,275 19,675 21,920 24,725 26,757
12 3,074 3,571 4,404 5,226 6,304 18,549 21,026 23,337 26,217 28,300
13 3,565 4,107 5,009 5,892 7,042 19,812 22,362 24,736 27,688 29,819
14 4,075 4,660 5,629 6,571 7,790 21,064 23,685 26,119 29,141 31,319
15 4,601 5,229 6,262 7,261 8,547 22,307 24,996 27,488 30,578 32,801
16 5,142 5,812 6,908 7,962 9,312 23,542 26,296 28,845 32,000 34,267
17 5,697 6,408 7,564 8,672 10,085 24,769 27,587 30,191 33,409 35,718
18 6,265 7,015 8,231 9,390 10,865 25,989 28,869 31,526 34,805 37,156
19 6,844 7,633 8,907 10,117 11,651 27,204 30,144 32,852 36,191 38,582
20 7,434 8,260 9,591 10,851 12,443 28,412 31,410 34,170 37,566 39,997
21 8,034 8,897 10,283 11,591 13,240 29,615 32,671 35,479 38,932 41,401
22 8,643 9,542 10,982 12,338 14,041 30,813 33,924 36,781 40,289 42,796
23 9,260 10,196 11,689 13,091 14,848 32,007 35,172 38,076 41,638 44,181
24 9,886 10,856 12,401 13,848 15,659 33,196 36,415 39,364 42,980 45,559
25 10,520 11,524 13,120 14,611 16,473 34,382 37,652 40,646 44,314 46,928
26 11,160 12,198 13,844 15,379 17,292 35,563 38,885 41,923 45,642 48,290
27 11,808 12,879 14,573 16,151 18,114 36,741 40,113 43,195 46,963 49,645
28 12,461 13,565 15,308 16,928 18,939 37,916 41,337 44,461 48,278 50,993
29 13,121 14,256 16,047 17,708 19,768 39,087 42,557 45,722 49,588 52,336
30 13,787 14,953 16,791 18,493 20,599 40,256 43,773 46,979 50,892 53,672
31 14,458 15,655 17,539 19,281 21,434 41,422 44,985 48,232 52,191 55,003
32 15,134 16,362 18,291 20,072 22,271 42,585 46,194 49,480 53,486 56,328
33 15,815 17,074 19,047 20,867 23,110 43,745 47,400 50,725 54,776 57,648
3.4 16,501 17,789 19,806 21,664 23,952 44,903 48,602 51,966 56,061 58,964
35 17,192 18,509 20,569 22,465 24,797 46,059 49,802 53,203 57,342 60,275
36 17,887 19,233 21,336 23,269 25,643 47,212 50,998 54,437 58,619 61,581
37 18,586 19,960 22,106 24,075 26,492 48,363 52,192 55,668 59,893 62,883
38 19,289 20,691 22,878 24,884 27,343 49,513 53,384 56,896 61,162 64,181
39 19,996 21,426 23,654 25,695 28,196 50,660 54,572 58,120 62,428 65,476
40 20,707 22,164 24,433 26,509 29,051 51,805 55,758 59,342 63,691 66,766
50 27,991 29,707 32,357 34,764 37,689 63,167 67,505 71,420 76,154 79,490
75 47,206 49,475 52,942 56,054 59,795 91,061 96,217 100,839 106,393 110,286
100 67,328 70,065 74,222 77,929 82,358 118,498 124,342 129,561 135,807 140,169

χν²表からの臨界値の決定

カイ二乗表の使い方はとても簡単です。このプロセスは、自由度、臨界値を取得する統計テストのタイプ、およびテストの有意水準の分析から始まります。

自由度

まず、確率変数に従う特定のカイ 2 乗関数を決定する必要があります。これは、自由度を決定することを意味します。自由度は、それを構築するために追加される独立した正規変数の数に対応するため、これは検定統計量をよく知っていることを意味します。

実行しているテストの種類に応じて、自由度の数の計算方法が異なります。次の表は、3 つの一般的なシナリオでどのように決定されるかを示しています。

試験の種類 自由度 (ν)
適合度のテスト ν = n – 1 (n はモデルの結果の数)
母分散の信頼区間 (s 2 ) ν = n – 1 (n は標本サイズ)
2 つのカテゴリ変数の独立性の検定 ν = ( r – 1 )( c – 1) (ここで、r と c は分割表の行と列の数です)

自由度の数によって、関心のある臨界値を探すカイ 2 乗表の行が決まります。テーブルには、自由度のすべての値が含まれているとは限りません。自由度が表示されない場合は、次の 3 つの方法があります。

  1. それを含むより完全な表を探してください。
  2. 直前の行を使用します。
  3. 前の行と次の行の間の値を補間します。

試験の種類

自由度の数を確立した後、作成しているのは信頼区間なのか、それとも仮説検定を行っているのかを確立する必要があります。後者の場合、それが片側検定か両側検定かを確認する必要もあります。これは、次のステップに関連しています。

重要なレベル

信頼区間と仮説検定の両方に有意水準が関連付けられており、これはタイプ I の誤りを犯す確率を指し、帰無仮説が真である場合にそれを棄却する確率を表します。第 1 種の過誤は一般に、仮説を検証する際に起こりうる最悪の過誤の 1 つと考えられているため、多くの試験はこの種の過誤を犯す確率に基づいて定義されています。

重要性のレベルは、科学的研究の開始時から研究者によって確立されます。彼または彼女は、仮説を検証することによって、どの程度の誤りのリスクを取りたいかを定義します。同様に、信頼区間を確立する場合、有意水準は、特定の値と母平均との差が変数のランダムな変動によるものであり、その値が実際に異なるという確率に関連しています。

カイ二乗表では、さまざまな有意水準の臨界値を見つけることができます。ただし、この値は、仮説検定が片側検定の場合にのみ直接使用できます。

両側仮説検定の場合、または信頼区間を確立している場合、エラーの確率は分布の両側に均等に分布します。これは、これらの場合、テーブルで 2 つの重要な値を探す必要があることを意味します。どちらも、検定の完全な有意水準の半分の有意水準に対応しています。

サンプルサイズ 25、有意水準 5% で母分散の両側仮説検定を行う場合、自由度 25 – 1 = 24 で 2 つの重要なカイ 2 乗値を決定する必要があります。および /2=0.05/2 = 0.025 です。

右裾の臨界値は α = 0.025 の値で見つかりますが、左裾の臨界値はその補数 1 – α = 1 – 0.025 = 0.975 で見つける必要があります。は左に 0.025 の領域を残します。これは、右に 0.975 の領域を残す値と同じです。別の方法として (より実際的には)、左裾については、p = 0.025 の値を探すことができます。これは、定義により、p が α の補数であるためです。このように、減算を実行する必要はありませんが、最初の行で p の値を探します。

この例では、対応する重要な値は 12,401 と 39,364 です。

参考文献

アドインソフト。(nd)。統計検定とは何ですか? https://help.xlstat.com/es/6758-what-statistical-test

ホームズ、A. (2015 年 3 月 31 日)。連続確率密度関数の特性 – ビジネス統計入門. プレスブック。https://opentextbc.ca/introbusinessstatopenstax/chapter/properties-of-continuous-probability-density-functions/

ミニタブ、LLC。(2022)。検定統計量とは ミニタブ。https://support.minitab.com/es-mx/minitab/19/help-and-how-to/statistics/basic-statistics/supporting-topics/basics/what-is-a-test-statistic/

Quevedo, F. (2011 年 12 月 1 日)。カイ二乗検定。メドウェーブ。https://www.medwave.cl/link.cgi/Medwave/Series/MBE04/5266

Rodó, P. (2021 年 7 月 7 日)。累積確率分布。エコノミペディア。https://economipedia.com/definiciones/distribucion-de-probabilidad-acumulada.html#:%7E:text=La%20distribuci%C3%B3n%20de%20probabilidad%20cumulada,mejor%20que%20%20un%20valor% 20コンクリート

Ruiz Mitjana, L. (2022 年 2 月 15 日)。カイ 2 乗 ( χ 2 )検定: 検定とは何か、統計でどのように使用されるか。心理学と心。https://psicologiaymente.com/miscelanea/prueba-chi-cuadrado

-広告-

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados