カイ2乗分布とは

 

引用元:http://kuchem.kyoto-u.ac.jp/ubung/yyosuke/uebung/stat06/stat06_lec0a.htm

カイ2乗分布は、上の様な分布で示されます。
いくつかの分布が描かれており、「 φ」というものも書かれていて分かりにくいと思います。まず、 φの意味について学習しましょう。
φとは自由度の事です。この自由度について例を挙げて考えてみましょう。
例えば、ある小学校の1〜3年生117人の児童が課外スポーツ活動に参加しているかどうかを調べたとします。そして1年生は29人中12人が
参加し、2年生は48人中18人が参加し、3年生は40人中15人が参加していると分かりました。この時、児童117人中45人が参加していると
分かれば、参加していないのは72人だと分かります。この様に2種類の数の内、1つが決まるともう1つも自動的に決まります。言い換えれば、自由に
動かせる数
は1つです。この数を自由度と呼び、2−1=1という様に求め、自由度1だと分かります。
また各学年の人数についても、児童117人中1年生が29人、2年生が48人だと分かれば、3年生は40人だと分かります。この場合は3種類の数の内、
2つが決まるともう1つも自動的に決まります
。つまり自由に動かせる数は2つで、自由度は3−1=2という様に求め、自由度2だと分かります。そして
この問題を解く為に求められる自由度は、(3−1)×(2−1)=2と計算し、自由度2だと分かります。
この自由度によってカイ2乗分布は変わってくるのです。この例題の場合は自由度2ですから、上の分布の自由度2を見ます。
また、学年によって課外スポーツ活動に参加する児童の割合は違うかを検定するのがカイ2乗検定です。
カイ2乗検定とは、このような分布に従う事象について帰無仮説を立てて、統計的に有意であるかどうかを検定する事です。
自由度2の分布を例にして、下のFlashでイメージしてみましょう。

カイ2乗分布について詳しく知りたい人はこちらへ