Tabla de Contenidos
パーソナル コンピューターが利用可能になる前、そしてスマートフォンが存在するずっと前に、一部の数学関数の数値計算は手作業で行う必要があり、これは非常に複雑でした。ただし、これらの計算結果は、統計などのさまざまなアプリケーションでも非常に重要でした。この問題の解決策は、一部の数学者が計算を実行し、それらを表にまとめて、結果が必要なときに参照として使用することに専念したことでした.
これらの例としては、三角関数 (サイン、コサイン、タンジェントなど) のテーブル、対数テーブル、およびカイ 2 乗テーブルを含む統計テーブルがあります。今日、Excel、Google Sheets、Mathematica、Minitab、R などの高度な計算プログラムがあり、すべての計算を数秒で実行できるという事実にもかかわらず、統計表の使用は依然として必要です。 、特にこれらのプログラムが何をしているかをよりよく理解するために。
上記を考慮して、自由度と有意水準を考慮して、カイ二乗表を使用してこの分布の臨界値を見つける方法を検討します。
カイ二乗分布 (χ ν ²) とは何ですか?
カイ 2 乗分布(ギリシャ文字のカイ、χ の 2 乗、つまり χ² に由来) は、 2 つの正規確率変数(標準の正規分布に従う)の 2 乗の合計を有する確率の統計的分布です。 ) であり、互いに独立しています。
つまり、確率変数 X の分布であり、次のように定義されます。
合計は、標準正規分布に従う ν 独立変数 Z iで作成されます(つまり、Z i ̴ N(0,1) が与えられます)。X を構成する独立変数νの数は、X の自由度の数と呼ばれます。
1900 年、ピアソンは、この確率変数が次の確率密度関数によって定義される確率分布に従うことを数学的に証明しました。
ここで、ν は自由度、Γ はガンマ分布関数、eはオイラー定数です。
自由度の数に応じて、この分布曲線はさまざまな形状になる可能性があります。
実際のケースの大多数では、自由度が 2 を超えており、この分布曲線のグラフは常に 0 から始まり、急速に増加してからゆっくりと減衰し、右に無限に長い裾を示します。
カイ二乗分布またはピアソン分布 (発明者にちなんで) と呼ばれることもありますが、これはガンマ分布の特殊なケースであり、推論統計で有意性の統計検定を実行し、間隔を確立するために広く使用されています。
統計における重要な値は何ですか?
臨界値は確率変数の特定の値であり、確率曲線の特定の領域をその上または下に残します。たとえば、臨界値は、確率密度曲線の領域の 5% を上に残す確率変数 X の値、または同じことですが、その値を下回る領域の 95% を表す可能性があります。
つまり、臨界値を定義するには、確率変数の確率密度関数を完全に知っている必要があり (つまり、その確率分布を知っている必要があります)、関心のある確率値を定義する必要があります。
たとえば、確率変数 X の臨界値として、 X < x cである確率が確率値 p に等しいような特定の値 x cを定義できます。つまり、この場合、確率 p の臨界値 x cは、次の式を満たすものになります。
これは、X > x cである確率で表されることもよくあります。p の補数であるこの確率はギリシャ文字 α で表され、一部のアプリケーションでは有意水準と呼ばれます。p の補数であるため、α = 1 – p は真です。
数学的な観点から、臨界値は通常、累積確率分布関数 (F (X) ) の観点から定義されます。これは、確率密度曲線の下の領域を表すためです。一般的に、臨界値 x cは次を満たすものです。
または、重要性に関しては、次の条件を満たすものです。
確率変数の分布に応じて、下限は 0 になる場合と、下限がない場合があります (上記の式のように)。
なぜ臨界値と呼ばれるのですか?
これは臨界値と呼ばれます。この値は、仮説検定中に検定統計量が許容範囲内か範囲外かを判断するための限界として、または信頼区間の限界を決定するためによく使用されるためです。
カイ二乗分布の臨界値
前の定義に基づいて、次の方程式を満たす変数の値 (x c ) として、自由度 ν のカイ 2 乗分布に従う確率変数の臨界値を定義できるようになりました。
これは、次のグラフを使用すると、より簡単に確認できます。
この画像でわかるように、臨界値は、曲線の下の領域を 2 つの部分に分割する x 軸の値 (確率変数 X の可能な値を表す) に対応します。 X < x cの確率、および uqe X > x cの確率、つまり 1 – P(X < x c ) を表すピンク色の領域。
カイ二乗表とは何ですか? また、何に使用されますか?
数学的定義からわかるように、臨界値の計算には、非常に複雑な関数を積分して x cの値を分離することが含まれます。これは、分析の観点から解決するのが非常に複雑です (実際にはほとんど不可能です)。したがって、これの代わりに、累積確率の異なる値を生成するxの値を1つずつ決定できるようにする方程式の積分と解決の数値的方法を使用することが行われます。
カイ 2 乗テーブルは、さまざまなカイ 2 乗分布関数 (自由度によって定義される) および p、α、またはその両方のさまざまな値のこれらの値のコレクションに対応します。
以下は、カイ二乗分布の臨界値、片側および両側統計検定で最も一般的に使用される値、および信頼区間を確立するための典型的な表の例です。
ぺ→ | 0,005 _ _ | 0 , 01 | 0,025 _ _ | 0.05 _ _ | 0 , 1 | 0.90 _ _ | 0.95 _ _ | 0,975 _ _ | 0.99 _ _ | 0,995 _ _ |
α → | 0,995 _ _ | 0.99 _ _ | 0,975 _ _ | 0.95 _ _ | 0.90 _ _ | 0 , 10 | 0.05 _ _ | 0,025 _ _ | 0 , 01 | 0,005 _ _ |
ν ↓ | ||||||||||
1 | 0,000 | 0,000 | 0.001 | 0.004 | 0.016 | 2,706 | 3,841 | 5,024 | 6,635 | 7,879 |
2 | 0.010 | 0.020 | 0.051 | 0.103 | 0.211 | 4,605 | 5,991 | 7,378 | 9,210 | 10,597 |
3 | 0.072 | 0.115 | 0.216 | 0.352 | 0.584 | 6,251 | 7,815 | 9,348 | 11,345 | 12,838 |
4 | 0.207 | 0.297 | 0.484 | 0.711 | 1,064 | 7,779 | 9,488 | 11,143 | 13,277 | 14,860 |
5 | 0.412 | 0.554 | 0.831 | 1,145 | 1,610 | 9,236 | 11,070 | 12,833 | 15,086 | 16,750 |
6 | 0.676 | 0.872 | 1,237 | 1,635 | 2,204 | 10,645 | 12,592 | 14,449 | 16,812 | 18,548 |
7 | 0.989 | 1,239 | 1,690 | 2,167 | 2,833 | 12,017 | 14,067 | 16,013 | 18,475 | 20,278 |
8 | 1,344 | 1,646 | 2,180 | 2,733 | 3,490 | 13,362 | 15,507 | 17,535 | 20,090 | 21,955 |
9 | 1,735 | 2,088 | 2,700 | 3,325 | 4,168 | 14,684 | 16,919 | 19,023 | 21,666 | 23,589 |
10 | 2,156 | 2,558 | 3,247 | 3,940 | 4,865 | 15,987 | 18,307 | 20,483 | 23,209 | 25,188 |
十一 | 2,603 | 3,053 | 3,816 | 4,575 | 5,578 | 17,275 | 19,675 | 21,920 | 24,725 | 26,757 |
12 | 3,074 | 3,571 | 4,404 | 5,226 | 6,304 | 18,549 | 21,026 | 23,337 | 26,217 | 28,300 |
13 | 3,565 | 4,107 | 5,009 | 5,892 | 7,042 | 19,812 | 22,362 | 24,736 | 27,688 | 29,819 |
14 | 4,075 | 4,660 | 5,629 | 6,571 | 7,790 | 21,064 | 23,685 | 26,119 | 29,141 | 31,319 |
15 | 4,601 | 5,229 | 6,262 | 7,261 | 8,547 | 22,307 | 24,996 | 27,488 | 30,578 | 32,801 |
16 | 5,142 | 5,812 | 6,908 | 7,962 | 9,312 | 23,542 | 26,296 | 28,845 | 32,000 | 34,267 |
17 | 5,697 | 6,408 | 7,564 | 8,672 | 10,085 | 24,769 | 27,587 | 30,191 | 33,409 | 35,718 |
18 | 6,265 | 7,015 | 8,231 | 9,390 | 10,865 | 25,989 | 28,869 | 31,526 | 34,805 | 37,156 |
19 | 6,844 | 7,633 | 8,907 | 10,117 | 11,651 | 27,204 | 30,144 | 32,852 | 36,191 | 38,582 |
20 | 7,434 | 8,260 | 9,591 | 10,851 | 12,443 | 28,412 | 31,410 | 34,170 | 37,566 | 39,997 |
21 | 8,034 | 8,897 | 10,283 | 11,591 | 13,240 | 29,615 | 32,671 | 35,479 | 38,932 | 41,401 |
22 | 8,643 | 9,542 | 10,982 | 12,338 | 14,041 | 30,813 | 33,924 | 36,781 | 40,289 | 42,796 |
23 | 9,260 | 10,196 | 11,689 | 13,091 | 14,848 | 32,007 | 35,172 | 38,076 | 41,638 | 44,181 |
24 | 9,886 | 10,856 | 12,401 | 13,848 | 15,659 | 33,196 | 36,415 | 39,364 | 42,980 | 45,559 |
25 | 10,520 | 11,524 | 13,120 | 14,611 | 16,473 | 34,382 | 37,652 | 40,646 | 44,314 | 46,928 |
26 | 11,160 | 12,198 | 13,844 | 15,379 | 17,292 | 35,563 | 38,885 | 41,923 | 45,642 | 48,290 |
27 | 11,808 | 12,879 | 14,573 | 16,151 | 18,114 | 36,741 | 40,113 | 43,195 | 46,963 | 49,645 |
28 | 12,461 | 13,565 | 15,308 | 16,928 | 18,939 | 37,916 | 41,337 | 44,461 | 48,278 | 50,993 |
29 | 13,121 | 14,256 | 16,047 | 17,708 | 19,768 | 39,087 | 42,557 | 45,722 | 49,588 | 52,336 |
30 | 13,787 | 14,953 | 16,791 | 18,493 | 20,599 | 40,256 | 43,773 | 46,979 | 50,892 | 53,672 |
31 | 14,458 | 15,655 | 17,539 | 19,281 | 21,434 | 41,422 | 44,985 | 48,232 | 52,191 | 55,003 |
32 | 15,134 | 16,362 | 18,291 | 20,072 | 22,271 | 42,585 | 46,194 | 49,480 | 53,486 | 56,328 |
33 | 15,815 | 17,074 | 19,047 | 20,867 | 23,110 | 43,745 | 47,400 | 50,725 | 54,776 | 57,648 |
3.4 | 16,501 | 17,789 | 19,806 | 21,664 | 23,952 | 44,903 | 48,602 | 51,966 | 56,061 | 58,964 |
35 | 17,192 | 18,509 | 20,569 | 22,465 | 24,797 | 46,059 | 49,802 | 53,203 | 57,342 | 60,275 |
36 | 17,887 | 19,233 | 21,336 | 23,269 | 25,643 | 47,212 | 50,998 | 54,437 | 58,619 | 61,581 |
37 | 18,586 | 19,960 | 22,106 | 24,075 | 26,492 | 48,363 | 52,192 | 55,668 | 59,893 | 62,883 |
38 | 19,289 | 20,691 | 22,878 | 24,884 | 27,343 | 49,513 | 53,384 | 56,896 | 61,162 | 64,181 |
39 | 19,996 | 21,426 | 23,654 | 25,695 | 28,196 | 50,660 | 54,572 | 58,120 | 62,428 | 65,476 |
40 | 20,707 | 22,164 | 24,433 | 26,509 | 29,051 | 51,805 | 55,758 | 59,342 | 63,691 | 66,766 |
50 | 27,991 | 29,707 | 32,357 | 34,764 | 37,689 | 63,167 | 67,505 | 71,420 | 76,154 | 79,490 |
75 | 47,206 | 49,475 | 52,942 | 56,054 | 59,795 | 91,061 | 96,217 | 100,839 | 106,393 | 110,286 |
100 | 67,328 | 70,065 | 74,222 | 77,929 | 82,358 | 118,498 | 124,342 | 129,561 | 135,807 | 140,169 |
χν²表からの臨界値の決定
カイ二乗表の使い方はとても簡単です。このプロセスは、自由度、臨界値を取得する統計テストのタイプ、およびテストの有意水準の分析から始まります。
自由度
まず、確率変数に従う特定のカイ 2 乗関数を決定する必要があります。これは、自由度を決定することを意味します。自由度は、それを構築するために追加される独立した正規変数の数に対応するため、これは検定統計量をよく知っていることを意味します。
実行しているテストの種類に応じて、自由度の数の計算方法が異なります。次の表は、3 つの一般的なシナリオでどのように決定されるかを示しています。
試験の種類 | 自由度 (ν) |
適合度のテスト | ν = n – 1 (n はモデルの結果の数) |
母分散の信頼区間 (s 2 ) | ν = n – 1 (n は標本サイズ) |
2 つのカテゴリ変数の独立性の検定 | ν = ( r – 1 )( c – 1) (ここで、r と c は分割表の行と列の数です) |
自由度の数によって、関心のある臨界値を探すカイ 2 乗表の行が決まります。テーブルには、自由度のすべての値が含まれているとは限りません。自由度が表示されない場合は、次の 3 つの方法があります。
- それを含むより完全な表を探してください。
- 直前の行を使用します。
- 前の行と次の行の間の値を補間します。
試験の種類
自由度の数を確立した後、作成しているのは信頼区間なのか、それとも仮説検定を行っているのかを確立する必要があります。後者の場合、それが片側検定か両側検定かを確認する必要もあります。これは、次のステップに関連しています。
重要なレベル
信頼区間と仮説検定の両方に有意水準が関連付けられており、これはタイプ I の誤りを犯す確率を指し、帰無仮説が真である場合にそれを棄却する確率を表します。第 1 種の過誤は一般に、仮説を検証する際に起こりうる最悪の過誤の 1 つと考えられているため、多くの試験はこの種の過誤を犯す確率に基づいて定義されています。
重要性のレベルは、科学的研究の開始時から研究者によって確立されます。彼または彼女は、仮説を検証することによって、どの程度の誤りのリスクを取りたいかを定義します。同様に、信頼区間を確立する場合、有意水準は、特定の値と母平均との差が変数のランダムな変動によるものであり、その値が実際に異なるという確率に関連しています。
カイ二乗表では、さまざまな有意水準の臨界値を見つけることができます。ただし、この値は、仮説検定が片側検定の場合にのみ直接使用できます。
両側仮説検定の場合、または信頼区間を確立している場合、エラーの確率は分布の両側に均等に分布します。これは、これらの場合、テーブルで 2 つの重要な値を探す必要があることを意味します。どちらも、検定の完全な有意水準の半分の有意水準に対応しています。
例
サンプルサイズ 25、有意水準 5% で母分散の両側仮説検定を行う場合、自由度 25 – 1 = 24 で 2 つの重要なカイ 2 乗値を決定する必要があります。および /2=0.05/2 = 0.025 です。
右裾の臨界値は α = 0.025 の値で見つかりますが、左裾の臨界値はその補数 1 – α = 1 – 0.025 = 0.975 で見つける必要があります。は左に 0.025 の領域を残します。これは、右に 0.975 の領域を残す値と同じです。別の方法として (より実際的には)、左裾については、p = 0.025 の値を探すことができます。これは、定義により、p が α の補数であるためです。このように、減算を実行する必要はありませんが、最初の行で p の値を探します。
この例では、対応する重要な値は 12,401 と 39,364 です。
参考文献
アドインソフト。(nd)。統計検定とは何ですか? https://help.xlstat.com/es/6758-what-statistical-test
ホームズ、A. (2015 年 3 月 31 日)。連続確率密度関数の特性 – ビジネス統計入門. プレスブック。https://opentextbc.ca/introbusinessstatopenstax/chapter/properties-of-continuous-probability-density-functions/
ミニタブ、LLC。(2022)。検定統計量とは ミニタブ。https://support.minitab.com/es-mx/minitab/19/help-and-how-to/statistics/basic-statistics/supporting-topics/basics/what-is-a-test-statistic/
Quevedo, F. (2011 年 12 月 1 日)。カイ二乗検定。メドウェーブ。https://www.medwave.cl/link.cgi/Medwave/Series/MBE04/5266
Rodó, P. (2021 年 7 月 7 日)。累積確率分布。エコノミペディア。https://economipedia.com/definiciones/distribucion-de-probabilidad-acumulada.html#:%7E:text=La%20distribuci%C3%B3n%20de%20probabilidad%20cumulada,mejor%20que%20%20un%20valor% 20コンクリート。
Ruiz Mitjana, L. (2022 年 2 月 15 日)。カイ 2 乗 ( χ 2 )検定: 検定とは何か、統計でどのように使用されるか。心理学と心。https://psicologiaymente.com/miscelanea/prueba-chi-cuadrado