倫理
- ニュルンベルク条項 (1947年):「許可できる医学実験」
- 自発的な同意(法的能力、強制がない、自由な意志、実験内容の理解)
- 他の方法では得られない、社会に有益な成果
- 動物実験と自然の経過に関する知識に基づく
- 不必要な身体的・心理的苦痛を避ける
- 死や障害が予測される実験はしない
- リスクが利益を上回らない
- 適切な準備と設備
- 科学的に資格がある実験者
- 被験者は自由に実験を中断できる
- 傷害が予測される場合、実験者は実験を中断する
- ヘルシンキ宣言 (1964、世界医師会)
- 自己決定権
- 脆弱で保護の必要な対象者に対する配慮
- 研究計画書の作成
- 承諾なき計画変更は不可
- 保護責任は医師にある
- データベースへの登録
- 消極的結果も公表されるべき
- 参加者が結果を知る権利
- GCP (Good clinical practice):正しく治験を実施するためのルール
- ICHによる:International Conference on Harmonization: 日米EU医薬品規制調和国際会議
- 厚生労働省令(法律を補う規則)による:医薬品の臨床試験の実施の基準に関する省令(平成九年三月二十七日厚生省令第二十八号、改正平成二六年七月三〇日厚生労働省令第八七号)
- 倫理指針
- 臨床研究の倫理指針(厚生労働省、平成15年)
- 人を対象とする医学系研究に関する倫理指針(文部科学省、厚生労働省、平成26年12月22日告示)
報告のガイドライン
- CONSORT (consolidated standard of reporting trials):
ランダム化比較試験(RCT)報告のガイドライン。試験デザイン・実施・解析・解釈の理解(understand a trial's design, conduct, analysis and interpretation)を可能とし、結果の妥当性を検証(assess the validity of its results)できる報告が求められる。
抄録(Abstract) | 試験デザイン(Design),方法(Method),結果(Result),結論(Conclusion)による構造化抄録 |
背景(Background) | 科学的背景, 論拠(Rationale), 仮説 |
方法(Method) | 試験デザイン, 参加者の適格基準(Eligibility criteria), 事前に定義された主要・副次的アウトカム, 症例数設定の根拠, ランダム化(Randomization)・ブラインディング(Blinding)の詳細、主要・副次的アウトカムの比較に用いられた統計学的手法 |
結果(Result) | ランダム割付けされた人数,意図された治療を受けた人数,主要アウトカムの解析に用いられた人数, 追跡不能例とランダム化後の除外例と理由(フローチャートの推奨), 各群のベースライン・データ, 主要・副次的アウトカムの各群の結果,介入のエフェクトサイズの推定とその精度(95%信頼区間など), 各群のすべての重要な害(Harm)または意図しない効果 |
考察(Discussion) | 試験の限界,可能性のあるバイアスや精度低下の原因, 一般化可能性(外的妥当性,適用性), 結果の解釈,有益性と有害性のバランス,他の関連するエビデンス |
その他 | 試験の登録, プロトコル, 資金源 |
- STROBE (Strengthening the Reporting of Observational Studies in Epidemiology):
観察研究の報告のガイドライン。主たるデザインであるコホート研究、症例対照研究、横断研究について。
- PRISMA(Preferred Reporting Items for Systematic Reviews and Meta-Analyses):
システマティックレビュー・メタアナリシスの報告について。
臨床研究の分類
- 観察研究 (Observational study)
- 症例報告: Case report 、症例集積研究: Case series(あわせて記述研究)
- 症例対照研究: Case control study
- 横断研究: Cross sectional study
- 前向きコホート研究: Prospective cohort study
- 後向きコホート研究: Retrospective cohort study
- 臨床試験 (Clinical study)
- 比較試験: Controlled
- 無比較研究: Uncontrolled
- メタ解析 (Meta analysis)
症例報告、症例集積研究
- 事実を記述する
- 仮説を生み出すもの、結論は導けない
コホート研究
- 開始時点で、因子や暴露の有無を測定
- ある期間観察され、影響を検討(イベントの発生、値の変化など)
- 疾患の発生率や自然経過、危険因子の研究
- フラミンガム研究、久山町研究など
- 後ろ向きコホート研究:過去に収集、記録した情報を使い、コホート研究を行う
横断研究(クロスセクショナル研究)
- ある時点で、対象を解析する
- 有病率の調査に代表される
- 新しい診断技術の有用性の検証 (vs. ゴールドスタンダード)
症例対照研究(ケースコントロール研究)
- 症例群(Case: 結果あり)と対照群(Control: 結果なし)の過去を分析し、因子・暴露の影響を検討
- まれな疾患や事象、長期にわたり進展する病態の研究
- 対照の選択に困難を伴う、バイアスが入りやすいデザイン
比較試験
- 実験処置群(Intervention)vs. 対照群(プラセボまたは標準治療)
- 処置以外、2群を同様に扱い、他の要因の影響を無くす(同時並行、盲検化、無作為割付)
- 非盲検化→患者・治療者による意識的、無意識的バイアス
- 非無作為割付→選択バイアス(高リスク患者が保守的治療となる傾向、期待される治療へ意図的に割付など)
無比較試験
- 歴史的に、推奨されていた治療が、比較試験で否定された事例にあふれている(効果が証明されない治療法が確立される可能性)
アウトカム(エンドポイント)
@ True EndpointとSurrogate Endpoint(真性変数と代替変数)
- True endpoint:最終的な治療目標の結果
- Surrogate endpoint:真性変数を予測できる変数
A Primary EndpointとSecondary Endpoint(主要評価項目と副次的評価項目)
- Primary Endpoint:とくに臨床試験では明確に定義する。測定の精度と確度がよいこと。Primary Endpointの推定値から症例数を設計する。
- 精度とは、複数回の測定でのばらつきの小ささの尺度(偶然誤差の小ささ)。確度とは、その値が「真値」に近い値であることを示す尺度(系統誤差の小ささ)。
- Secondary EndpointやSubgroup解析は、アウトカムに対する設定(症例数など)が最適ではなく、結果は結論的でない。
アウトカム変数の属性とよく利用される統計手法
目的変数 | 単変量解析 | 多変量解析 |
連続 | @t検定 A分散分析 BWilcoxon順位和検定 | G多重線形回帰分析(重回帰) |
二値 | C独立性検定 Dリスク比・オッズ比 E割合の検定 | Hロジスティック回帰分析 |
時間依存性 | Fログランク検定 | Iコックス比例ハザードモデル |
2つの連続変数の関連 |
J相関係数(Pearson, Spearman, Kendall) |
その他の多変量解析 |
主成分分析、判別分析、クラスター分析、パーティション解析など |
サンプルサイズ(N)の設定
- 必要以上の研究を省き、倫理的・経済的な面で重要
- Nが小さいと差を統計学的有意にし難い(検出力不足、パワー不足)
- 逆に、Nが大きいと意味のない差が統計学的有意になり易い
- 意味のある効果の推定量からサンプルサイズを設定する
(例)平均値の比較におけるサンプルサイズの設定
先行研究において、A群: 8.8±3.2、B群: 12.2±3.2であり、効果の大きさΔ=12.2-8.8=3.4、共通SD=3.2。検定の条件を、α=0.05(有意水準5%)、1-β=0.80(検出力80%)と設定。
サンプルサイズの公式より、群あたり15例となる。
N=2(Zα+Zβ)2 / (Δ/SD)2 + Zα2/4
=2(1.96+0.842)2/(3.4/3.2)2 + 1.962/4
=14.9
(例)割合の比較におけるサンプルサイズの設定の例
α=0.05(有意水準5%)、1-β=0.80(検出力80%)において、2群の割合の比較での必要症例数(群あたり)は以下のとおり。
| 70% | 50% | 30% | 10% |
90% | 61 | 19 | 10 | 6 |
70% | | 94 | 23 | 10 |
50% | | | 94 | 19 |
30% | | | | 61 |
統計解析の例
@t検定による2群の平均値の比較
群 | 値 | 要約 |
A | 100,110,120,120,130,130,130,140,140,150,160 | 130±5.2, n=11 |
B | 80,90,100,100,110,110,110,120,120,130,140 | 110±5.2, n=11 |
推定:平均値の差、20 [4.5, 36] (点推定と区間推定)
検定:p値は0.014(t検定、両側)
解釈:差があるとみなす
Q:
A:
@' 対応のあるt検定(1群の平均値が0と異なるか否か)
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 要約 |
前 | 63 | 55 | 42 | 42 | 50 | 62 | 42 | / |
後 | 41 | 43 | 44 | 42 | 38 | 44 | 50 | / |
Δ | -22 | -12 | 2 | 0 | -12 | -18 | 8 | -7.7±11.2, n=7 |
推定:Δの平均値、-7.7 [-18.1, 2.6]
検定:p=0.12(t検定、両側)
解釈:差があるとはいえない
A分散分析による3群以上の平均値の比較
群 | 値 | 要約 |
A | 100,110,120,120,130,130,130,140,140,150,160 | 130±5.2, n=11 |
B | 80,90,100,100,110,110,110,120,120,130,140 | 110±5.2, n=11 |
C | 90,100,110,110,120,120,120,130,130,140,150 | 120±5.2, n=11 |
検定:p=は0.038(分散分析、自由度調整R2乗 0.14)
解釈:3群の平均値に差があるとみなす
A' 多重比較の調整(チューキー法)
検定:p=0.029(AvsB), 0.38(AvsC), 0.38(BvsC)
解釈:A-B群の平均値に差があるとみなす
A'' 多重比較の調整(ボンフェローニ法)
検定:調整なしp=0.011(AvsB), 0.19(AvsC), 0.19(BvsC)、検定数(3)を乗じ
調整ありp=0.033(AvsB), 0.57(AvsC), 0.57(BvsC)
解釈:A-B群の平均値に差があるとみなす
BWilcoxon順位和検定による比較
群 | 値 | 要約(中央値・四分位範囲) |
A | 20,20,28,30,32,34,40,40,50,60,70 | 34 [28, 50], n=11 |
B | 20,30,40,50,50,58,60,62,64,70,80 | 58 [40, 64], n=11 |
(箱ひげ図、ボックスプロット)
検定:p=0.065(Wilcoxon順位和検定)
解釈:差があるとはいえない
B’Wilcoxon順位和検定による比較(例数を倍にとった場合)
群 | 値 | 要約 |
A | 20,20,28,30,32,34,40,40,50,60,70 | 34 [28, 50], n=22 |
A追加 | 20,20,28,30,32,34,40,40,50,60,70 |
B | 20,30,40,50,50,58,60,62,64,70,80 | 58 [40, 64], n=22 |
B追加 | 20,30,40,50,50,58,60,62,64,70,80 |
検定:p=0.008(Wilcoxon順位和検定)
解釈:差があるとみなす
BとB’は同じ要約値であるが、例数が多いと統計学的有意になる。実質的に意味のある差かどうか、意味のある差に対して適切なサンプル数が用いられているかをよく考える必要がある。
C独立性検定(χ2乗近似・Fisher正確確率)
(2x2クロス表・分割表)
因子 | イベントあり | イベントなし |
A | 45 | 55 |
B | 30 | 70 |
検定:p=0.028(χ2乗近似による独立性検定)
p=0.041(Fisher正確確率法)
解釈:因子とイベントは独立でない(因子とイベント発生は関連があるとみなす)
Dリスク比・オッズ比
(2x2クロス表・分割表)
因子 | イベントあり | イベントなし | リスク | オッズ | リスク比 | オッズ比 |
A | 45 | 55 | 0.45 | 0.82 | 1.5 | 1.9 |
B | 30 | 70 | 0.30 | 0.43 |
リスク(発症率/罹患率/Incidence):45/100=0.45(A群)、30/100=0.30(B群)
オッズ:45/55=0.82(A群)、30/70=0.43(B群)
推定:リスク比(RR: relative risk)1.5 [1.03, 2.18]
オッズ比(OR: odds ratio)1.9 [1.06, 3.42]
解釈:AはBに比してイベントのリスクが高い、またはイベントのオッズが高いとみなす
E割合の検定
因子 | 事象数 | 観察数 | 割合 |
A | 45 | 100 | 0.45 |
B | 30 | 100 | 0.30 |
推定:割合の差 0.15 [0.016, 0.28]
検定:p=0.028
解釈:2群の割合に差があるとみなす
Fログランク検定
(生存率表)
群 | ID | 時間 | 打切 | N | 故障率 | 生存率 | 累積 |
A |
1 | 5 | 0 | 8 | 0.125 | 0.875 | 0.875 |
2 | 15 | 1 | 7 | | | |
3 | 20 | 1 | 6 | | | |
4 | 25 | 0 | 5 | 0.200 | 0.800 | 0.700 |
5 | 30 | 1 | 4 | | | |
6 | 35 | 1 | 3 | | | |
7 | 40 | 1 | 2 | | | |
8 | 40 | 1 | 1 | | | |
群 | ID | 時間 | 打切 | N | 故障率 | 生存率 | 累積 |
B |
9 | 5 | 0 | 8 | 0.125 | 0.875 | 0.875 |
10 | 10 | 0 | 7 | 0.286 | 0.714 | 0.625 |
11 | 10 | 0 | 7 |
12 | 15 | 0 | 5 | 0.200 | 0.800 | 0.500 |
13 | 20 | 0 | 4 | 0.250 | 0.750 | 0.375 |
14 | 25 | 0 | 3 | 0.333 | 0.667 | 0.250 |
15 | 30 | 0 | 2 | 0.500 | 0.500 | 0.125 |
16 | 40 | 1 | 1 | | | |
(累積生存率曲線:カプランマイヤー法)
検定:p=0.030(ログランク検定)
解釈:2群の生存時間に差があるとみなす
G多重線形回帰分析
Y(目的変数) | A | B | C | C'(ダミー変数) |
100 | 40 | 4 | 大 | 1 |
90 | 60 | 3 | 大 | 1 |
60 | 55 | 7 | 大 | 1 |
70 | 40 | 5 | 小 | 0 |
40 | 25 | 9 | 小 | 0 |
90 | 70 | 2 | 大 | 1 |
50 | 40 | 4 | 小 | 0 |
110 | 65 | 1 | 大 | 1 |
60 | 40 | 7 | 大 | 1 |
70 | 50 | 5 | 大 | 1 |
70 | 45 | 3 | 小 | 0 |
50 | 40 | 4 | 小 | 0 |
項 | 推定値 | p値 |
切片 | 117.3 | 0.004 |
A | -0.56 | 0.30 |
B | -7.96 | 0.008 |
C' | 29.2 | 0.014 |
予測式:Y=117.3-0.56×A-7.96×B+29.2×C'(自由度調整R2乗 0.76、p=0.002)
解釈:アウトカムYに対して、因子Bと因子Cが影響する。Yは、Bが1単位増えると7.96減少し、C'が1であると(Cが大であると)29.2増える。
G’多重線形回帰分析(2)(Aの分散分析のデータ)
Y | 群 | X1ダミー | X2ダミー |
100,110,120,120,130,130,130,140,140,150,160 | A | 0 | 0 |
80,90,100,100,110,110,110,120,120,130,140 | B | 1 | 0 |
90,100,110,110,120,120,120,130,130,140,150 | C | 0 | 1 |
項 | 推定値 | p値 |
切片 | 130 | 0.0001 |
X1 | -20 | 0.01 |
X2 | -10 | 0.19 |
予測式:Y=130-20×X1-10×X2(自由度調整R2乗 0.14、p=0.038)
解釈:分散分析のp値、R2乗値と一致する(Aを参照)
係数(推定値)は各群の平均の差となる
A群に比し、B群は20低く(p=0.01)、C群は10低い(p=0.19)
G''多重線形回帰分析(3)(説明変数X3の追加、共分散分析)
Y | 群 | X1 | X2 | X3共変量 |
100,110,120,120,130,130,130,140,140,150,160 | A | 0 | 0 | 4,5,4,6,7,4,8,10,9,10,11 |
80,90,100,100,110,110,110,120,120,130,140 | B | 1 | 0 | 4,5,7,4,6,8,4,9,8,9,10 |
90,100,110,110,120,120,120,130,130,140,150 | C | 0 | 1 | 12,10,8,11,13,10,12,14,11,12,16 |
項 | 推定値 | p値 |
切片 | 90.2 | 0.0001 |
X1 | -18 | 0.0009 |
X2 | -36 | 0.0001 |
X3 | 5.6 | 0.0001 |
予測式:Y=90.2-18×X
1-36×X
2+5.6×X
3(自由度調整R2乗 0.63、p=0.0001)
解釈:Yに対して影響をもつ共変量X
3によって補正
X
1、X
2のいずれもが有意となる
A群に比し、B群は18低く、C群は36低い(C群の方がより低下する結果になる)
Hロジスティック回帰分析
Event | 群 | X1ダミー | X2ダミー | X3 |
0,1,1,1,1,0,1,1,0,1,1 | A | 0 | 0 | 4.5/5.5/6/7/6.5/6.5/6.5/7/7/7.5/8 |
0,0,0,0,1,0,0,0,0,0,0 | B | 1 | 0 | 4/4.5/5/5/5.5/5.5/4.5/6/6/6.5/7 |
0,0,1,0,1,1,1,0,1,1,1 | C | 0 | 1 | 4.5/5/5.5/5.5/6/6.5/6/6.5/7.5/7/9 |
項 | 推定値 | p値 |
切片 | -6.04 | 0.09 |
X1 | -2.57 | 0.054 |
X2 | -0.075 | 0.94 |
X3 | 1.10 | 0.047 |
尤度比検定では各パラメータのp値は、X1: 0.03, X2: 0.94, X3: 0.021
イベントの発生率をpとすると、
予測式:log(p/(1-p))= -6.04-2.57×X1-0.075×X2+1.10×X3
解釈:イベント生起にX1(AvsB)、X3が影響しているとみなす
さらに、
e -2.57=0.076は、X1が1単位増加したときのオッズ比
e -0.075=0.92は、X2が1単位増加したときのオッズ比
e 1.10=3.00は、X3が1単位増加したときのオッズ比
統計ソフトに説明変数として”群”と”X3”をそのまま入れた場合、
予測式:log(p/(1-p))= -6.93 +(B:-1.69,C: 0.807,A: 0.882) +1.10×X3となり、値は上記に一致する。
B群: -8.61+1.10×X3と-8.62+1.10×X3
C群: -6.11+1.10×X3と-6.12+1.10×X3
A群: -6.04+1.10×X3と-6.05+1.10×X3
H’ロジスティック回帰分析
X
3だけでロジスティック回帰を行いROC曲線をかくと、
矢印のところで、感度1.0、特異度0.47を与えるX
3のカットオフ値5.5、
矢頭のところで、感度0.5、特異度0.88を与えるカットオフ値6.7が定まる。
(感度を優先すべきか(スクリーニングなど)、特異度を優先すべきか(確定診断など)による)
Iコックス比例ハザードモデル
参考文献
* Designing Clinical Research 3rd(医学研究のデザイン 研究の質を高める疫学的アプローチ)
* Epidemiology 4th(疫学 医学的研究と実践のサイエンス)
* 入門 統計解析法(日科技連)
先頭へ
2017/Jan, 2016/Aug, 2014/Dec, 2012/