3. 2群のデータの種類とその比較と相関係数のt検定

統計の基本として2つのグループデータを比較することがあります。
(1) データの計り方
まずはデータが等間隔スケール(定規のようにメモリが等間隔になっている)で計測されたデータとそうでないデータで分けます。
データの計測スケール
・等間隔:パラメトリック検定 (mm, Kg, mg/dl, 回/分)
・非等間隔:ノンパラメトリック検定 (痛みの程度、VASスケール、分類など)

(2) 群間の対応あるなし
次に2つの群間に対応があるかどうかを考えます。対応ありのデータは主に同じ披験者で計測しています。対応なしの群では異なる披験者で集めていて、それぞれの群のデータ数は同じでなくてもかまいません。ただし、対応なしのデータでは、2群のデータが等分散かどうかで検定法が異なります。表計算のデータではttest関数の検定の種類が違います。まずはf検定(ftest)を行い等分散か非等分散かを調べます。
・対応ありの群の例:同一披験者で計測。運動前後の血圧の上昇、感冒の治療薬Aの投与前後でののどの痛みの変化

・対応なしの群の例:異なる披験者で計測、もしくは異なる種類の計測の群間。100mダッシュのランニングによる血圧の上昇と100mを自由形で泳いだときの血圧の上昇の比較、男女のある種のタンパク濃度の比較など。

パラメトリック検定とノンパラメトリック検定にはそれぞれ対応あり、なしのデータがあり、次のような検定法がよく用いられます。

(a) パラメトリック検定(TTEST関数を利用
・対応あり:student ttest
・対応なし:  student ttest / 等分散の検定 fttest(<0.05; 等分散)

(b) ノンパラメトリック検定
・対応あり:Willcoxonの検定
・対応なし:Mann-Whitneyの検定

検定の結果の書き方

(3) 相関係数のt検定
相関係数rが有意であるかどうかを検定することができます。
「データの母相関係数σ=0」を帰無仮説H0としてならばt値は以下の式に従います。得られたt値をt分布表で 自由度(n-2)の時の値と比較し、t分布表の値より大きければ有意な相関係数ということになります。
stat_corr_ttest