臨床研究|大阪大学 免疫内科

研究

臨床研究の方法

倫理

報告のガイドライン

臨床研究の分類

症例報告、症例集積研究

コホート研究

横断研究(クロスセクショナル研究)

症例対照研究(ケースコントロール研究)

比較試験

無比較試験

アウトカム(エンドポイント)

@ True EndpointとSurrogate Endpoint(真性変数と代替変数)

A Primary EndpointとSecondary Endpoint(主要評価項目と副次的評価項目)

アウトカム変数の属性とよく利用される統計手法

目的変数単変量解析多変量解析
連続@t検定
A分散分析
BWilcoxon順位和検定
G多重線形回帰分析(重回帰)
二値C独立性検定
Dリスク比・オッズ比
E割合の検定
Hロジスティック回帰分析
時間依存性Fログランク検定Iコックス比例ハザードモデル
2つの連続変数の関連
J相関係数(Pearson, Spearman, Kendall)
その他の多変量解析
主成分分析、判別分析、クラスター分析、パーティション解析など

サンプルサイズ(N)の設定

(例)平均値の比較におけるサンプルサイズの設定

先行研究において、A群: 8.8±3.2、B群: 12.2±3.2であり、効果の大きさΔ=12.2-8.8=3.4、共通SD=3.2。検定の条件を、α=0.05(有意水準5%)、1-β=0.80(検出力80%)と設定。

サンプルサイズの公式より、群あたり15例となる。
N=2(Zα+Zβ)2 / (Δ/SD)2 + Zα2/4
=2(1.96+0.842)2/(3.4/3.2)2 + 1.962/4 =14.9

(例)割合の比較におけるサンプルサイズの設定の例

α=0.05(有意水準5%)、1-β=0.80(検出力80%)において、2群の割合の比較での必要症例数(群あたり)は以下のとおり。

70%50%30%10%
90%6119106
70% 942310
50% 9419
30% 61

統計解析の例

@t検定による2群の平均値の比較

要約
A100,110,120,120,130,130,130,140,140,150,160130±5.2, n=11
B80,90,100,100,110,110,110,120,120,130,140110±5.2, n=11
推定:平均値の差、20 [4.5, 36] (点推定と区間推定)
検定:p値は0.014(t検定、両側)
解釈:差があるとみなす
Q: 
A: 

@' 対応のあるt検定(1群の平均値が0と異なるか否か)

1234567要約
63554242506242
41434442384450
Δ-22-1220-12-188-7.7±11.2, n=7
推定:Δの平均値、-7.7 [-18.1, 2.6]
検定:p=0.12(t検定、両側)
解釈:差があるとはいえない

A分散分析による3群以上の平均値の比較

要約
A100,110,120,120,130,130,130,140,140,150,160130±5.2, n=11
B80,90,100,100,110,110,110,120,120,130,140110±5.2, n=11
C90,100,110,110,120,120,120,130,130,140,150120±5.2, n=11
検定:p=は0.038(分散分析、自由度調整R2乗 0.14)
解釈:3群の平均値に差があるとみなす

A' 多重比較の調整(チューキー法)

検定:p=0.029(AvsB), 0.38(AvsC), 0.38(BvsC)
解釈:A-B群の平均値に差があるとみなす

A'' 多重比較の調整(ボンフェローニ法)

検定:調整なしp=0.011(AvsB), 0.19(AvsC), 0.19(BvsC)、検定数(3)を乗じ
   調整ありp=0.033(AvsB), 0.57(AvsC), 0.57(BvsC)
解釈:A-B群の平均値に差があるとみなす

BWilcoxon順位和検定による比較

要約(中央値・四分位範囲)
A20,20,28,30,32,34,40,40,50,60,7034 [28, 50], n=11
B20,30,40,50,50,58,60,62,64,70,8058 [40, 64], n=11
(箱ひげ図、ボックスプロット)
検定:p=0.065(Wilcoxon順位和検定)
解釈:差があるとはいえない

B’Wilcoxon順位和検定による比較(例数を倍にとった場合)

要約
A20,20,28,30,32,34,40,40,50,60,7034 [28, 50], n=22
A追加20,20,28,30,32,34,40,40,50,60,70
B20,30,40,50,50,58,60,62,64,70,8058 [40, 64], n=22
B追加20,30,40,50,50,58,60,62,64,70,80
検定:p=0.008(Wilcoxon順位和検定)
解釈:差があるとみなす
BとB’は同じ要約値であるが、例数が多いと統計学的有意になる。実質的に意味のある差かどうか、意味のある差に対して適切なサンプル数が用いられているかをよく考える必要がある。

C独立性検定(χ2乗近似・Fisher正確確率)

(2x2クロス表・分割表)
因子イベントありイベントなし
A4555
B3070
検定:p=0.028(χ2乗近似による独立性検定)
   p=0.041(Fisher正確確率法)
解釈:因子とイベントは独立でない(因子とイベント発生は関連があるとみなす)

Dリスク比・オッズ比

(2x2クロス表・分割表)
因子イベントありイベントなしリスクオッズリスク比オッズ比
A45550.450.821.51.9
B30700.300.43
リスク(発症率/罹患率/Incidence):45/100=0.45(A群)、30/100=0.30(B群)
オッズ:45/55=0.82(A群)、30/70=0.43(B群)
推定:リスク比(RR: relative risk)1.5 [1.03, 2.18]
   オッズ比(OR: odds ratio)1.9 [1.06, 3.42]
解釈:AはBに比してイベントのリスクが高い、またはイベントのオッズが高いとみなす

E割合の検定

因子事象数観察数割合
A451000.45
B301000.30
推定:割合の差 0.15 [0.016, 0.28]
検定:p=0.028
解釈:2群の割合に差があるとみなす

Fログランク検定

(生存率表)
ID時間打切N故障率生存率累積
A 15080.1250.8750.875
21517
32016
425050.2000.8000.700
53014
63513
74012
84011
ID時間打切N故障率生存率累積
B 95080.1250.8750.875
1010070.2860.7140.625
111007
1215050.2000.8000.500
1320040.2500.7500.375
1425030.3330.6670.250
1530020.5000.5000.125
164011
(累積生存率曲線:カプランマイヤー法)
検定:p=0.030(ログランク検定)
解釈:2群の生存時間に差があるとみなす

G多重線形回帰分析

Y(目的変数)ABCC'(ダミー変数)
1004041
906031
605571
704050
402590
907021
504040
1106511
604071
705051
704530
504040
推定値p値
切片117.30.004
A-0.560.30
B-7.960.008
C'29.20.014
予測式:Y=117.3-0.56×A-7.96×B+29.2×C'(自由度調整R2乗 0.76、p=0.002)
解釈:アウトカムYに対して、因子Bと因子Cが影響する。Yは、Bが1単位増えると7.96減少し、C'が1であると(Cが大であると)29.2増える。

G’多重線形回帰分析(2)(Aの分散分析のデータ)

YX1ダミーX2ダミー
100,110,120,120,130,130,130,140,140,150,160A00
80,90,100,100,110,110,110,120,120,130,140B10
90,100,110,110,120,120,120,130,130,140,150C01
推定値p値
切片1300.0001
X1-200.01
X2-100.19
予測式:Y=130-20×X1-10×X2(自由度調整R2乗 0.14、p=0.038)
解釈:分散分析のp値、R2乗値と一致する(Aを参照)
   係数(推定値)は各群の平均の差となる
   A群に比し、B群は20低く(p=0.01)、C群は10低い(p=0.19)

G''多重線形回帰分析(3)(説明変数X3の追加、共分散分析)

YX1X2X3共変量
100,110,120,120,130,130,130,140,140,150,160A004,5,4,6,7,4,8,10,9,10,11
80,90,100,100,110,110,110,120,120,130,140B104,5,7,4,6,8,4,9,8,9,10
90,100,110,110,120,120,120,130,130,140,150C0112,10,8,11,13,10,12,14,11,12,16
推定値p値
切片90.20.0001
X1-180.0009
X2-360.0001
X35.60.0001
予測式:Y=90.2-18×X1-36×X2+5.6×X3(自由度調整R2乗 0.63、p=0.0001)
解釈:Yに対して影響をもつ共変量X3によって補正
   X1、X2のいずれもが有意となる
   A群に比し、B群は18低く、C群は36低い(C群の方がより低下する結果になる)

Hロジスティック回帰分析

EventX1ダミーX2ダミーX3
0,1,1,1,1,0,1,1,0,1,1A004.5/5.5/6/7/6.5/6.5/6.5/7/7/7.5/8
0,0,0,0,1,0,0,0,0,0,0B104/4.5/5/5/5.5/5.5/4.5/6/6/6.5/7
0,0,1,0,1,1,1,0,1,1,1C014.5/5/5.5/5.5/6/6.5/6/6.5/7.5/7/9
推定値p値
切片-6.040.09
X1-2.570.054
X2-0.0750.94
X31.100.047
尤度比検定では各パラメータのp値は、X1: 0.03, X2: 0.94, X3: 0.021
イベントの発生率をpとすると、
予測式:log(p/(1-p))= -6.04-2.57×X1-0.075×X2+1.10×X3
解釈:イベント生起にX1(AvsB)、X3が影響しているとみなす
   さらに、
   e -2.57=0.076は、X1が1単位増加したときのオッズ比
   e -0.075=0.92は、X2が1単位増加したときのオッズ比
   e 1.10=3.00は、X3が1単位増加したときのオッズ比
統計ソフトに説明変数として”群”と”X3”をそのまま入れた場合、
予測式:log(p/(1-p))= -6.93 +(B:-1.69,C: 0.807,A: 0.882) +1.10×X3となり、値は上記に一致する。
B群: -8.61+1.10×X3と-8.62+1.10×X3
C群: -6.11+1.10×X3と-6.12+1.10×X3
A群: -6.04+1.10×X3と-6.05+1.10×X3

H’ロジスティック回帰分析

X3だけでロジスティック回帰を行いROC曲線をかくと、

矢印のところで、感度1.0、特異度0.47を与えるX3のカットオフ値5.5、
矢頭のところで、感度0.5、特異度0.88を与えるカットオフ値6.7が定まる。
(感度を優先すべきか(スクリーニングなど)、特異度を優先すべきか(確定診断など)による)

Iコックス比例ハザードモデル

参考文献

* Designing Clinical Research 3rd(医学研究のデザイン 研究の質を高める疫学的アプローチ)
* Epidemiology 4th(疫学 医学的研究と実践のサイエンス)
* 入門 統計解析法(日科技連)
先頭へ
2017/Jan, 2016/Aug, 2014/Dec, 2012/