学習内容
実測度数,期待度数,帰無仮説,有意水準などの用語を理解する。 
定義式に基づいてχ2を計算して検定する。 
Excel関数を使ってχ2検定を行なう。 
Excel の関数 
chiinv (a,n)・・・自由度n ,有意水準 aに対する χ2を与える
chidist (χ2,n)・・・自由度n に対する確率 P(>χ2)を与える 
chitest (実測度数,期待度数)・・・自由度(行数−1)×(列数−1)に対する確率 P(>χ2)を与える        
−−−−−−−−−−−−−−−−− 目の数 1 2 3 4 5 6 度数 14 5 12 5 11 13 −−−−−−−−−−−−−−−−−[解説] 2の目,4の目は出にくそうである。正常なサイコロならどの目も10回出るだろう。このように分布がある規則に則っているかどうかにはχ2検定を行う。理論はテキストに譲ってExcelの関数としてはchitestを使う。「サイコロは正常でどの目も10回出る」という仮説(帰無仮説)を立て,それが起こる確率を計算し,有意水準(通常0.05)より小さければその仮説を棄却するのである。この場合サイコロが正常である確率は15%にも達するのでその仮説は否定できない。
例題2 92,603,1137,1254,987,125 は 
2項分布に従っているか?
[解説] これら6つの数が自由度 n=6−1=5に対する2項分布に従うとしてその期待度数を計算する。
          2項係数は 5Ck=5!/(5!×k!)
                                  
=1          (k=0,5)
                                  
=5          (k=1,4)
                                  
=10        (k=2,3)
これら2項係数の総和は32であり,実測度数の総和は3868だから各々の期待度数は 
          3868×1/32=120.88     
(k=0,5)
          3868×5/32=604.38     
(k=1,4) 
          3868×10/32=1208.75 
(k=2,3) となる。
これより各々の(実測度数−期待度数)2/期待度数 
,その和を求めると χ2=17.577 。 一方, chiinv 関数より有意水準 0.01に対してχ02=15.086 
また,有意水準 0.05に対してχ02=11.070 であるから いずれの場合でも χ2 >χ02 
よって帰無仮説は棄てられ,2項分布に従っているとはいえない。 実際,この実測度数,期待度数に対応する確率を chitest 関数より,上記χ2,自由度に対する 
確率を chidist 関数より求めると0.35%である。 
例題3 甲乙の2つの地区で血液型の分布を調査した。 
この結果より分布の違いがあるといえるか? 
                     
甲          乙 
          −−−−−−−−−−−−
              A     
43%      30%
              O     
31         40 
              B    
19          20 
             AB     
7          10 
           −−−−−−−−−−−−
[解説]地区による違いはないという帰無仮説をたてる。甲乙の平均の各血液型の分布は 36.5,35.5,19.5,8.5 % 
であり,これを期待度数とする。実測度数,期待度数ともに2×4の表値となり,自由度は(2−1)×(4−1)=3。chitest 
関数によってその確率を求めると,0.260 となり有意水準 0.05 を越えるので帰無仮説は棄てられない。よって分布の違いがあるといえない。 
例題4 
住居の種類を地域によって分類した調査表からその違いを調べる。
                        
1個建  2軒長屋 テラスハウス 
     −−−−−−−−−−−−−−−−− 
           北部        
95     297      242 
           中部      
175     417      362 
           南部      
703     994      861 
     −−−−−−−−−−−−−−−−−
[解説] 地域による違いはないという帰無仮説をたてる。 各行,各列について計を求めると期待度数は 
        1個建,北部の期待度数は (北部の計)×(1個建の計)/(総計) 
     2軒長屋,北部の期待度数は (北部の計)×(2軒長屋の計)/(総計)
     テラスハウス,北部の期待度数は (北部の計)×(テラスハウス)/(総計)
        1個建,中部の期待度数は (中部の計)×(1個建の計)/(総計) 
       ・・・・・・・・・・・・・・・・・・・・・・・・・・・
   というように計算できる。chitest 関数を使って 表(A)の実測度数,期待度数に対する確率 を求めると 7.6E-13 
となり帰無仮説は棄てられる。自由度は(3−1)×(3−1)=4である。 しかし表を(B)にように書くと確率を1.3E-10 
と計算してしまうが,これは自由度9−1=8 の場合となるので注意。
        解答  
問題1 金曜には交通事故が多いといわれるが下表からそうだといえるか,有意水準5% で検定せよ。
          −−−−−−−−−−−−−−−−−−− 
     曜日     日    月   火   水    木     金  土 
     度数   14  18  12  13  14  23 18  
          −−−−−−−−−−−−−−−−−−−
 
問題2 薬を飲んで場合,飲まない場合,それぞれ病気に罹ったか否かの集計表がある。
                                       
病気  健康 
               
−−−−−−−−−−−−
             薬を飲んだ          
20     50 
             薬を飲まず          
15    15 
              
−−−−−−−−−−−−
この薬は効いたといえるか,有意水準5% で検定せよ。
問題3 0から9までランダムな整数を100個選んでその頻度分布の一様性を,有意水準5% で検定せよ。
戻る |