学習内容
実測度数,期待度数,帰無仮説,有意水準などの用語を理解する。
定義式に基づいてχ2を計算して検定する。
Excel関数を使ってχ2検定を行なう。
Excel の関数
chiinv (a,n)・・・自由度n ,有意水準 aに対する χ2を与える
chidist (χ2,n)・・・自由度n に対する確率 P(>χ2)を与える
chitest (実測度数,期待度数)・・・自由度(行数−1)×(列数−1)に対する確率 P(>χ2)を与える
−−−−−−−−−−−−−−−−− 目の数 1 2 3 4 5 6 度数 14 5 12 5 11 13 −−−−−−−−−−−−−−−−−[解説] 2の目,4の目は出にくそうである。正常なサイコロならどの目も10回出るだろう。このように分布がある規則に則っているかどうかにはχ2検定を行う。理論はテキストに譲ってExcelの関数としてはchitestを使う。「サイコロは正常でどの目も10回出る」という仮説(帰無仮説)を立て,それが起こる確率を計算し,有意水準(通常0.05)より小さければその仮説を棄却するのである。この場合サイコロが正常である確率は15%にも達するのでその仮説は否定できない。
例題2 92,603,1137,1254,987,125 は
2項分布に従っているか?
[解説] これら6つの数が自由度 n=6−1=5に対する2項分布に従うとしてその期待度数を計算する。
2項係数は 5Ck=5!/(5!×k!)
=1 (k=0,5)
=5 (k=1,4)
=10 (k=2,3)
これら2項係数の総和は32であり,実測度数の総和は3868だから各々の期待度数は
3868×1/32=120.88
(k=0,5)
3868×5/32=604.38
(k=1,4)
3868×10/32=1208.75
(k=2,3) となる。
これより各々の(実測度数−期待度数)2/期待度数
,その和を求めると χ2=17.577 。 一方, chiinv 関数より有意水準 0.01に対してχ02=15.086
また,有意水準 0.05に対してχ02=11.070 であるから いずれの場合でも χ2 >χ02
よって帰無仮説は棄てられ,2項分布に従っているとはいえない。 実際,この実測度数,期待度数に対応する確率を chitest 関数より,上記χ2,自由度に対する
確率を chidist 関数より求めると0.35%である。
例題3 甲乙の2つの地区で血液型の分布を調査した。
この結果より分布の違いがあるといえるか?
甲 乙
−−−−−−−−−−−−
A
43% 30%
O
31 40
B
19 20
AB
7 10
−−−−−−−−−−−−
[解説]地区による違いはないという帰無仮説をたてる。甲乙の平均の各血液型の分布は 36.5,35.5,19.5,8.5 %
であり,これを期待度数とする。実測度数,期待度数ともに2×4の表値となり,自由度は(2−1)×(4−1)=3。chitest
関数によってその確率を求めると,0.260 となり有意水準 0.05 を越えるので帰無仮説は棄てられない。よって分布の違いがあるといえない。
例題4
住居の種類を地域によって分類した調査表からその違いを調べる。
1個建 2軒長屋 テラスハウス
−−−−−−−−−−−−−−−−−
北部
95 297 242
中部
175 417 362
南部
703 994 861
−−−−−−−−−−−−−−−−−
[解説] 地域による違いはないという帰無仮説をたてる。 各行,各列について計を求めると期待度数は
1個建,北部の期待度数は (北部の計)×(1個建の計)/(総計)
2軒長屋,北部の期待度数は (北部の計)×(2軒長屋の計)/(総計)
テラスハウス,北部の期待度数は (北部の計)×(テラスハウス)/(総計)
1個建,中部の期待度数は (中部の計)×(1個建の計)/(総計)
・・・・・・・・・・・・・・・・・・・・・・・・・・・
というように計算できる。chitest 関数を使って 表(A)の実測度数,期待度数に対する確率 を求めると 7.6E-13
となり帰無仮説は棄てられる。自由度は(3−1)×(3−1)=4である。 しかし表を(B)にように書くと確率を1.3E-10
と計算してしまうが,これは自由度9−1=8 の場合となるので注意。
解答
問題1 金曜には交通事故が多いといわれるが下表からそうだといえるか,有意水準5% で検定せよ。
−−−−−−−−−−−−−−−−−−−
曜日 日 月 火 水 木 金 土
度数 14 18 12 13 14 23 18
−−−−−−−−−−−−−−−−−−−
問題2 薬を飲んで場合,飲まない場合,それぞれ病気に罹ったか否かの集計表がある。
病気 健康
−−−−−−−−−−−−
薬を飲んだ
20 50
薬を飲まず
15 15
−−−−−−−−−−−−
この薬は効いたといえるか,有意水準5% で検定せよ。
問題3 0から9までランダムな整数を100個選んでその頻度分布の一様性を,有意水準5% で検定せよ。
戻る |