Clinical Journal Club 10. Meta-analysis (メタアナリシス) 2
Dataの結合方法
Dataを結合する方法として、 (1) Simple average (単純平均)、(2) Weighted average (重み付け平均)、の2つが挙げられます。単純平均は非常に簡単(データを全て足し合わせるだけ)なので、ついこれを採用したくなりますが、Simpson's Paradox (シンプソンズ パラドックス)という落とし穴に陥る場合がありますので、注意が必要です。
Simpson's Paradoxの例
例1:野球の打率
New York YankeesのDerek Jeterと、Atlanta Braves時代のDavid Justiceの打率を以下に示します。
1995年 | 1996年 | 2年間の単純平均 | |
Derek Jeter | 12安打/48打数 = .250 |
183安打/582打数 = .314 |
195安打/630打数 = .310 |
David Justice | 104安打/411打数 = .253 |
45安打/140打数 = .321 |
149安打/551打数 = .270 |
1995年度、1996年度のいずれにおいても、Justiceの打率が上回っていますが、単純平均をすると、Jeterの打率が上になってしまうのです。あれれ?
Jeterの打数が1995年度には少なく、逆に、Justiceの打数は1996年に少ないことで、このような現象が起こるようです。
同様の現象は、1997年度を加えても見られます。
1995年 | 1996年 | 1997年 | 3年間の単純平均 | |
Derek Jeter | 12/48 = .250 |
183/582 = .314 |
190/654 = .291 |
385/1284 = .300 |
David Justice | 104/411 = .253 |
45/140 = .321 |
163/495 = .329 |
312/1046 = .298 |
Ken Ross. "A Mathematician at the Ballpark: Odds and Probabilities for Baseball Fans (Paperback)" Pi Press, 2004. ISBN 0131479903. 12-13
例2:腎結石治療
実際に行われた腎結石の治療効果を以下に示します。小さな結石症例だけを対象にした場合も、大きな結石だけを対象にした場合も、開腹手術の治療成績が良いことが分かります。しかし、単純平均を取ると、経皮的砕石術の成績が良くなってしまいました。あれれ?
これは、より難しい大きな結石には、手術が選択されるのに対して、簡単な小さな結石症例には、経皮的砕石術が選択される(結石の大きさによるConfoundingがある)為です。
小さな結石 | 大きな結石 | 大小結石の単純平均 | |
開腹手術 | 81/87 = 93% |
192/263 = 72% |
273/350 = 78% |
経皮的砕石術 | 234/270 = 87% |
55/80 = 69% |
289/350 = 83% |
C. R. Charig, D. R. Webb, S. R. Payne, O. E. Wickham (1986 March 29). "Comparison of treatment of renal calculi by operative surgery, percutaneous nephrolithotomy, and extracorporeal shock wave lithotripsy". Br Med J (Clin Res Ed) 292 (6524): 879-882.
メタアナリシス(Meta-analysis)で結果を結合する際にも、Simple average (単純平均)だけではSimpson's Paradoxに陥り、結果が逆転してしまう事があるので、Weighted average (重み付け平均)が重要なのです。
Simpson's Paradox (or the Yule-Simpson effect)の歴史
実は、初めてこの現象を記載したのはSimpsonではなく、Yuleだったので、the Yule-Simpson effectと呼ばれることもあります。個人名を用いない場合には、reversal paradox とかamalgamation paradoxと呼ばれることもあります。
(*amalgamation: 合併、融合)
Simpson's Paradoxの歴史
1903年 | Udny Yule | 初めて報告 |
1951年 | Edward H. Simpson | 2番目に報告 |
Karl Pearson | ||
1972年 | Colin R. Blyth | Simpson's Paradoxと呼ぶ |
正しい結合方法: Weighted average(重み付け平均)
Meta-analysisで用いるWeighted average (重み付け平均)の手法には、 (1) Fixed effects model (FEM): 固定効果モデル、(2) Random effects model (REM): ランダム効果モデル、の2つが挙げられます。真実の結果が単一である(と考えられる)場合には、Fixed effects model (FEM)を用い、真実の結果が複数存在する(と考えられる)場合には、Random effects model (REM)を用います。
解釈としては、FEMが「治療法は、現在までに成された研究結果の中で効果が有ったと言えるか?」に対して、REMでは「治療法は一般的に言って効果があるか? (解釈の対象を一般化)」と考えると良いでしょう。
各スタディーが均一 (homogeneous)であれば、両者の結果はほぼ同じになりますが、不均一 (heterogeneous)の場合には、REMの信頼区間は広くなる傾向があります。どちらを用いるかについては定説がありません。
実際の計算表は、森實敏夫先生のサイトが役に立ちます。
http://www.kdcnet.ac.jp/hepatology/technique/statistics/meta.htm