トップページ > 臨床研究の紹介 > Clinical Journal Club > 17. 傾向検定

Clinical Journal Club 17. 傾向検定

   独立している2群間において正規分布している連続変数を比較する場合、適応すべき検定は対応のないt検定(unpaired t test)です。それでは、独立した3群以上の多群間比較を行う場合には、どのような検定を適応するべきでしょうか?

   下図の第1、2、3、4群は、標準偏差(standard deviation: SD)を1.00に固定し、平均値を0.00、0.10、0.20、0.30に設定し、乱数を100個発生させて作成した標本です。実際の平均値±SDは、第1群 0.03±1.07、第2群 0.09±1.08、第3群 0.26±1.05、第4群 0.38±0.86です。以下、様々な検定法を用いて、この4群間に統計学的に有意な差が認められるかを確認してみましょう。

2群間比較(対応のないt検定)の繰り返し

   特に基礎研究の論文でよく見受けられますが、ひたすらt検定による2群間比較を繰り返すという方法です。4群を比較する場合、下図の様に、4C2 = 6回のt検定を繰り返す事になります。

   この場合、問題になるのが、多重比較によるfamilywise error rateです。αレベルを0.05に設定したt検定を6回も繰り返すと、1回でもp < 0.05となる確率(familywise error rate)は、1 - 0.956 = 0.26になります。そこで、Bonferroni法等の方法を用いて、それぞれのt検定のαレベルを調整する必要性があるわけです。

   上記の場合、第1群と第4群を比較した場合のp値が最も小さいわけですが、Bonferroni法で補正したp値 = 0.0106 X 6 = 0.0636であり、第1群と第4群の間に統計学的に優位な差があるとは言えません。

   多重比較の問題点とその対応策に関しては、Clincal Journal Club 1. 多重比較をご覧下さい。

分散分析

   全体の平均値と各群の平均値を比較して、大きくずれている群が一つでもあるかないかを検定するのが、分散分析(analysis of variance: ANOVA)です。あくまでも、大きく平均値が異なる群の有無を検定しているだけなので、どの群の平均値が全体平均からずれているかはわかりません。したがって、一般には、ANOVAでp値 < 0.05となった場合、どの群とどの群の間に有意差が認められているのかを特定するために、ポストホック比較(post hoc comparison)が必要になります。

   上記の標本に対してANOVAを行った結果、p = 0.060でした。

傾向検定

   慢性腎臓病(chronic kidney disease: CKD)の5段階のステージ分類の様に、群の順番に何らかの意味があれば、傾向検定も選択肢の一つです。群(ステージ)が進むにつれて、対象の値が単調増加あるいは単調減少していれば、p < 0.05になります。

   上記の標本に対して傾向検定(STATAのnptrendコマンド)を行った結果、p = 0.006であり、単調増加傾向にある事が統計学的に明らかです。

   さてここで、下記の様に、群の順番を第1群 -> 第4群 -> 第2群 -> 第3群に変えてみたらどうなるでしょうか?

   当然の事ながら、傾向検定のp値は、0.450に上昇し、もはや統計学に有意な値ではありません。一方ANOVAのp値は、群の順番が変わっても、全く影響を受けません。多群間の比較という意味では同じANOVAと傾向検定ですが、全く性質が異なります。

傾向検定の種類

単変量モデル

   従属変数の種類によって、適応すべき検定が異なります。代表的な単変量傾向検定は、下記の通りです。

従属変数 傾向検定 参考文献
Cochran-Armitage trend test JAMA 2007; 298: 309-316
CJASN 2008; 3 : 1296-1300
連続変数 Jonckheere-Terpstra trend test Hypertens Res 2008; 31: 1163-70
生存時間 Log-rank trend test JAMA 2007; 298: 299-308

多変量モデル

   中央値、平均値、順番を表す整数等を、各群の代表値として取扱って、一独立変数として多変量モデルに組み込み、傾向検定とする事ができます。詳しくは、参考文献をご覧下さい。

代表値 参考文献
中央値 JAMA 2007; 298: 309-316
平均値 Arch Intern Med 2006; 166: 1403-1409
整数 JAMA 2007; 298: 299-308