3. 基本的な検定

[I] 2群の検定:統計の基本として2つのグループデータを比較することがあります。
(1) データの計り方による違い
まずはデータが等間隔スケール(定規のようにメモリが等間隔になっている)で計測されたデータとそうでないデータで分けます。
データの計測スケール
・等間隔スケール:パラメトリック検定 (mm, Kg, mg/dl, 回/分)
・非等間隔スケール:ノンパラメトリック検定 (痛みの程度、VASスケール、分類など, 回/分

(2) 群間の対応あるなし
次に2つの群のデータ間に対応があるかどうかを考えます。対応ありのデータは主に同じ披験者で計測しています。対応なしの群では異なる披験者からデータを集めていて、それぞれの群のデータの間に関係がなく、データ数は異なっていてもかまいません。ただし、対応なしのデータでは、2群のデータが等分散かどうかで検定法が異なります。表計算のデータではttest関数の検定の種類が違います。まずはf検定(ftest)を行い等分散か非等分散かを調べます。
対応ありの群の例:同一披験者で計測。(a)運動前後の血圧の上昇、(b)感冒の治療薬Aの投与前後でののどの痛みの変化

対応なしの群の例:異なる披験者で計測、もしくは異なる種類の計測の群間比較。(a)男女のある種のタンパク濃度の比較、(b)100mダッシュのランニングによる血圧の上昇と100mを自由形で泳いだときの血圧の上昇の比較など。

(3)2群の検定の方法のまとめ

パラメトリック検定とノンパラメトリック検定にはそれぞれ対応あり、なしのデータがあり、次のような検定法がよく用いられます。

(a) パラメトリック検定(TTEST関数を利用
・対応あり:student ttest
・対応なし:  student ttest / 等分散の検定 fttest(<0.05; 等分散)

(b) ノンパラメトリック検定
・対応あり:Willcoxonの検定
・対応なし:Mann-Whitneyの検定

* 経時的変化を関数の係数でt検定する
 経時的変化の群間比較をするときに、各時点を多重比較する方法がよく採用される。しかし、経時的変化の比較では各時相の比較ではなく全体的な変化を比較したいことあがる。このためには、2群の比較としてその経時的変化に関数をフィットさせ、その係数を2群の比較とするとt検定でその経時的変化の違いを検定することができる。
 例としては指数的に減少する数量が5時点で観測された場合、5群の検定とせずに、減少指数関数をフィットして、その時定数をt検定することになります。また、冷却パットを当てたときの体表面の温度を計測した場合の経時的変化は、フェルミ関数をフィットすることで階段的変化を係数として表すことができる。y=a/(exp(x/b)+1)としてa,bの係数を決定する。aは階段の変化の大きさを表すことになる。bとしては変位が1であればbは0.1-0.5程度となる。

検定の結果の書き方

[II] カイ二乗検定(カイ2乗検定) (wikipedia:カイ二乗検定 Chi-squared testまたは\chi ^2検定

カイ二乗検定とは帰無仮説が正しければ検定統計量がカイ二乗分布に従うような統計学的検定法の総称であるとwikipediaでは定義されています。例としては、得られたデータが期待される分布に従っているかどうかを検定に利用されます。たとえばある学校の学生から無作為に男女あわせて100人を選んだとき、男女の比率は50人ずつになることが期待されます。この期待通りの比率になっているかを調べる検定がカイ二乗検定です。また、治療Aを評価するのために、年齢を関係なくサンプリングしたとします。このとき治療Aの評価が年齢によって偏っていないかをチェックする場合にも利用できます。この例では以下のような表ができます。

治療法Aの評価:若年者;有効 15人(A11)/無効45人(A12), 高齢者:有効 25人(A21)/無効 35人(A22)

表計算ソフトではCHITEST関数を利用して偏りがない確立を計算します。値が0.05未満であれば、危険率5%で”偏りがある”ことがわかります。CHITEST関数を利用するにはまず、期待値を計算します。治療Aを好むか、好まないかなどの1次元であれば、期待値は0.5、0.5となりますが、上の条件の場合は、若年者の全体にしめる割合は50%なので若年者である確率は0.5となります。一方、有効と答えるのは全体の33%(=40/120)なので、有効と答える確率は0.33となる。従って、若年者で有効と答える期待値は0.5*0.33=0.17となります。また、若年者で無効の期待値は0.5*0.67=0.33となります。このようにして基地値(E11,E12,E21,E22)が求められます。
CHITEST(A11:A22, E11:E22)として計算されます。

[III] 相関係数のt検定

相関係数rが有意であるかどうかを検定することができます。
「データの母相関係数σ=0」を帰無仮説H0としてならばt値は以下の式に従います。得られたt値をt分布表で 自由度(n-2)の時の値と比較し、t分布表の値より大きければ有意な相関係数ということになります。
stat_corr_ttest