χ検定
 

学習内容
実測度数,期待度数,帰無仮説,有意水準などの用語を理解する。
定義式に基づいてχ2を計算して検定する。
Excel関数を使ってχ2検定を行なう。
Excel の関数
chiinv (a,n)・・・自由度n ,有意水準 aに対する χ2を与える
chidist (χ2,n)・・・自由度n に対する確率 P(>χ2)を与える
chitest (実測度数,期待度数)・・・自由度(行数−1)×(列数−1)に対する確率 P(>χ2)を与える       


例題1 下表はサイコロを60回振って各々の目の出る度数をまとめたものである。このサイコロは正常といえるか,有意水準5% で検定せよ。
          −−−−−−−−−−−−−−−−− 
     目の数     1   2    3   4     5     6 
     度数    14   5  12   5   11  13 
          −−−−−−−−−−−−−−−−−
[解説] 2の目,4の目は出にくそうである。正常なサイコロならどの目も10回出るだろう。このように分布がある規則に則っているかどうかにはχ2検定を行う。理論はテキストに譲ってExcelの関数としてはchitestを使う。「サイコロは正常でどの目も10回出る」という仮説(帰無仮説)を立て,それが起こる確率を計算し,有意水準(通常0.05)より小さければその仮説を棄却するのである。この場合サイコロが正常である確率は15%にも達するのでその仮説は否定できない。

例題2 92,603,1137,1254,987,125 は 2項分布に従っているか?
[解説] これら6つの数が自由度 n=6−1=5に対する2項分布に従うとしてその期待度数を計算する。
          2項係数はk=5!/(5!×k!)
                                  =1          (k=0,5)
                                  =5          (k=1,4)
                                  =10        (k=2,3)
これら2項係数の総和は32であり,実測度数の総和は3868だから各々の期待度数は
          3868×1/32=120.88     (k=0,5)
          3868×5/32=604.38     (k=1,4)
          3868×10/32=1208.75 (k=2,3) となる。
これより各々の(実測度数−期待度数)2/期待度数 ,その和を求めると χ2=17.577 。 一方, chiinv 関数より有意水準 0.01に対してχ02=15.086 また,有意水準 0.05に対してχ02=11.070 であるから いずれの場合でも χ2 >χ02 よって帰無仮説は棄てられ,2項分布に従っているとはいえない。 実際,この実測度数,期待度数に対応する確率を chitest 関数より,上記χ2,自由度に対する 確率を chidist 関数より求めると0.35%である。



例題3 甲乙の2つの地区で血液型の分布を調査した。 この結果より分布の違いがあるといえるか?
                     甲          乙
          −−−−−−−−−−−−
              A     43%      30%
              O     31         40
              B    19          20
             AB     7          10
           −−−−−−−−−−−−
[解説]地区による違いはないという帰無仮説をたてる。甲乙の平均の各血液型の分布は 36.5,35.5,19.5,8.5 % であり,これを期待度数とする。実測度数,期待度数ともに2×4の表値となり,自由度は(2−1)×(4−1)=3。chitest 関数によってその確率を求めると,0.260 となり有意水準 0.05 を越えるので帰無仮説は棄てられない。よって分布の違いがあるといえない。



例題4 住居の種類を地域によって分類した調査表からその違いを調べる。
                        1個建  2軒長屋 テラスハウス
     −−−−−−−−−−−−−−−−−
           北部        95     297      242
           中部      175     417      362
           南部      703     994      861
     −−−−−−−−−−−−−−−−−
[解説]
地域による違いはないという帰無仮説をたてる。 各行,各列について計を求めると期待度数は
        1個建,北部の期待度数は (北部の計)×(1個建の計)/(総計)
     2軒長屋,北部の期待度数は (北部の計)×(2軒長屋の計)/(総計)
     テラスハウス,北部の期待度数は (北部の計)×(テラスハウス)/(総計)
        1個建,中部の期待度数は (中部の計)×(1個建の計)/(総計)
       ・・・・・・・・・・・・・・・・・・・・・・・・・・・
   というように計算できる。chitest 関数を使って 表(A)の実測度数,期待度数に対する確率 を求めると 7.6E-13 となり帰無仮説は棄てられる。自由度は(3−1)×(3−1)=4である。 しかし表を(B)にように書くと確率を1.3E-10 と計算してしまうが,これは自由度9−1=8 の場合となるので注意。
        解答



問題1 金曜には交通事故が多いといわれるが下表からそうだといえるか,有意水準5% で検定せよ。

          −−−−−−−−−−−−−−−−−−− 
     曜日     日    月   火   水    木     金  土 
     度数   14  18  12  13  14  23 18  
          −−−−−−−−−−−−−−−−−−−

問題2 薬を飲んで場合,飲まない場合,それぞれ病気に罹ったか否かの集計表がある。
                                       病気  健康
               −−−−−−−−−−−−
             薬を飲んだ          20     50
             薬を飲まず          15    15
              −−−−−−−−−−−−
この薬は効いたといえるか,有意水準5% で検定せよ。

問題3 0から9までランダムな整数を100個選んでその頻度分布の一様性を,有意水準5% で検定せよ。

戻る