3. 基本的な検定
1. データのはかり方(尺度水準)とパラメットリック検定とノンパラメトリック検定
2. 群間の対応ある・なし
3. 2群の検定
4. 多群の比較検定-分散分析
5. カイ二乗検定
6. 相関係数と回帰直線

1. データの計り方と尺度水準
 データが等間隔スケール(、cmやg, mol/mlなどがあります)で計測されたデータとそうでないデータで分けることができます。等間隔のスケールで計測された
データの計測スケール
・等間隔スケール:定規のように目盛りが等間隔になっている単位で、mm, Kg, mg/dlなどが間隔尺度のデータが含まれます。これらはパラメトリック検定と呼ばれる検定方法で計算されます。
・非等間隔スケール:目盛りが等間隔でないスケールで計測されたデータで痛みの程度などアンケートの分類、VASスケール、pH(水素イオン濃度指数)、分類などが含まれます。 回/分ノンパラメトリック検定 と呼ばれる検定方法で計算されます。また、間隔尺度であっても正規性が認められないデータについてはノンパラメトリック検定が利用されます。

2. 群間の対応ある・なし
 次に2つの群のデータ間に対応があるかどうかを考えます。
(a) 対応ありのデータ:主に同一披験者で計測しています。(例:(a)運動前後の血圧の上昇、(b)感冒の治療薬Aの投与前後でののどの痛みの変化など)
(b) 対応なしのデータ:異なる披験者からデータを集めていて、それぞれの群のデータの間に関係がなく、データ数は異なっていてもかまいません。また、同じ被験者でも異なる状態で計測される場合(かなり計測日に隔たりがあり、その人の状態が同じであることが保証されないようなデータを計測する場合など)は対応なしのデータとして取り扱うことが望まれます。(例:(a)男女のある種のタンパク濃度の比較、(b)100mダッシュのランニングによる血圧の上昇と100mを自由形で泳いだときの血圧の上昇の比較など。)
 対応なしのデータで2群の検定では、2群のデータが等分散かどうかで検定法が異なります。表計算のデータではttest関数の検定の種類が違います。等分散か非等分散かはf検定(ftest)を行い調べます。

3.2群の検定の方法

パラメトリック検定とノンパラメトリック検定にはそれぞれ対応あり、なしのデータがあり、次のような検定法がよく用いられます。

(a) パラメトリック検定(TTEST関数を利用
対応ありstudent ttest
対応なしstudent ttest / 等分散の検定 fttest(<0.05; 等分散)

(b) ノンパラメトリック検定
対応ありWillcoxonの検定
対応なしMann-Whitneyの検定
検定を行った結果は確率Pで示され、Pが0.05以下および0.01の有意水準を指標に、検定の結果を表現します。検定の結果の書き方
* 経時的変化を関数の係数でt検定する
 経時的変化の群間比較をするときに、各時点を多重比較する方法がよく採用される。しかし、経時的変化の比較では各時相の比較ではなく全体的な変化を比較したいことあがる。このためには、2群の比較としてその経時的変化に関数をフィットさせ、その係数を2群の比較とするとt検定でその経時的変化の違いを検定することができる。
 例としては指数的に減少する数量が5時点で観測された場合、5群の検定とせずに、減少指数関数をフィットして、その時定数をt検定することになります。また、冷却パットを当てたときの体表面の温度を計測した場合の経時的変化は、フェルミ関数をフィットすることで階段的変化を係数として表すことができる。y=a/(exp(x/b)+1)としてa,bの係数を決定する。aは階段の変化の大きさを表すことになる。bとしては変位が1であればbは0.1-0.5程度となる。

4. 分散分析 (工事中)

5. カイ二乗検定(カイ2乗検定) (wikipedia:カイ二乗検定 Chi-squared testまたは\chi ^2検定

カイ二乗検定とは帰無仮説が正しければ検定統計量がカイ二乗分布に従うような統計学的検定法の総称であるとwikipediaでは定義されています。例としては、得られたデータが期待される分布に従っているかどうかを検定に利用されます。たとえばある学校の学生から無作為に男女あわせて100人を選んだとき、男女の比率は50人ずつになることが期待されます。この期待通りの比率になっているかを調べる検定がカイ二乗検定です。また、治療Aを評価するのために、年齢を関係なくサンプリングしたとします。このとき治療Aの評価が年齢によって偏っていないかをチェックする場合にも利用できます。この例では以下のような表ができます。

治療法Aの評価:若年者;有効 15人(A11)/無効45人(A12), 高齢者:有効 25人(A21)/無効 35人(A22)

表計算ソフトではCHITEST関数を利用して偏りがない確立を計算します。値が0.05未満であれば、危険率5%で”偏りがある”ことがわかります。CHITEST関数を利用するにはまず、期待値を計算します。治療Aを好むか、好まないかなどの1次元であれば、期待値は0.5、0.5となりますが、上の条件の場合は、若年者の全体にしめる割合は50%なので若年者である確率は0.5となります。一方、有効と答えるのは全体の33%(=40/120)なので、有効と答える確率は0.33となる。従って、若年者で有効と答える期待値は0.5*0.33=0.17となります。また、若年者で無効の期待値は0.5*0.67=0.33となります。このようにして基地値(E11,E12,E21,E22)が求められます。
CHITEST(A11:A22, E11:E22)として計算されます。

6. 相関係数のt検定

相関係数rが有意であるかどうかを検定することができます。
「データの母相関係数σ=0」を帰無仮説H0としてならばt値は以下の式に従います。得られたt値をt分布表で 自由度(n-2)の時の値と比較し、t分布表の値より大きければ有意な相関係数ということになります。
stat_corr_ttest