偏差値って有効?
試験のデータの整理から受験指導まで偏差値がよく使われています。偏差値を使う時には,暗黙のうちに
- 受験者数は非常に多いこと
- 点数分布は正規分布をしていること
が前提とされています。統計処理にはサンプル数が多ければ多いほど正確で,1万以上が必要でしょう。
正規分布とは平均 m と標準偏差σを使って次式で表されるものです。
f(x)=exp[−(x−m)2/2σ2]/[σ√(2π)]
これをグラフに描くと平均 m でピークとなり左右対称な曲線が得られます。
m が大きいと曲線は右へ寄り,またσが大きいほど曲線はなだらかになります。すなわちmは曲線のピーク位置を,σはピークの鋭さを表すパラメータです。下左図において黒線は平均70点標準偏差10点の場合,紫線は平均45点標準偏差25点の場合の正規分布を表します。
曲線 y=f(x) と2つの直線 x=x1 , x=x2 で囲まれた面積は x が x1 から x2 までの値をとる確率を表します。この面積を計算するには上記 f(x) を積分する必要がありますが,その積分は数値的にしかできません。シンプソンの公式で計算した結果は
- m − σ から m + σ までの値をとる確率は約68%
- m − 2σ から m + 2σ までの値をとる確率は約95%
- − ∞ から ∞ までの値をとる確率(全確率)は100%
です。平均が50点に標準偏差が10点になるように調整したものが右の図で,ある点数範囲に入る比率は次のフォームで計算できます。
実際にはまず起こりませんが,標準偏差が小さいと偏差値が 100 を超える場合もありえます。また標準偏差が大きいと素点がどうあれ,偏差値はほとんど50あたりに集中してしまいますね。右表は平均 40 の場合,第1列の素点を第1行の標準偏差で偏差値に変換したものです。偏差値だけで実力を判断するのは危険です。点数分布がダブルピークなど正規分布から程遠い場合は偏差値の考え方自体が無効になってしまいます。