TOPへ戻る

 

第10回セミナー報告

大阪小児先進医療研究会の第10回セミナーが平成16年4月13日(火)に銀杏会館大会議室で行われました。

セミナーの模様(講演者:加藤菊也先生)

 

 演 題

 

トランスクリプトームデータの解析方法 〜 癌の予測問題を中心に
【講師】
加藤 菊也 先生
大阪府立成人病センター 研究所

 

 セミナー要旨

 
(はじめに)
これまで多くの遺伝子発現プロファイルに関する報告がなされているが、その解析には統計学的に間違いが多い。今回は、遺伝子プロファイルデータの解析に関して述べていく。
1、遺伝子発現データに関して
cDNAマイクロアレイや我々が採用しているATAC-PCR法により得られる遺伝子発現の生データは、まず対数変換を行い正規化する必要がある。これにより、種々の統計学的手法を使用できるようになる。また、サンプル毎のmRNA量によるバイアスを除去するために、サンプル毎に遺伝子発現量のメディアンで補正を行う。
2、単変量解析に関して
発現に差のある遺伝子を同定するなど個々の測定を別々に扱う解析方法をさす。解析方法としてはパラメトリック法であるt統計量とノンパラメトリック法であるPermutative p valueが代表的である。比較する2群間でサンプル数に差があるときは、Permutative p valueが有用である。最も注意すべきことは偽陽性の問題であり、その解決方法として統計学的にはbonferroniの補正やfalse discovery rate(FDR)を行う。
3、多変量解析に関して
遺伝子発現解析では、典型的には癌の予後判定などの解析に用いられる。教師なし学習と教師あり学習に分かれる。教師なし学習の代表的解析方法に階層的クラスター分析と主成分分析がある。階層的クラスター分析は、遺伝子発現パターンの類似度で遺伝子またはサンプルをグループ化する解析方法である。主成分分析は高次元のデータのもつ情報を、少数個の総合特性値に要約する方法である。我々は、主成分分析の応用解析法であるパラメトリッククラスタリングを開発し、検討を加えている。これらの解析方法を行う際の注意点は、これらの解析法は可視化のツールとして考えるべきで、この結果から断定的な結論を得るものではないということである。教師あり学習は以下のような過程で行われる。1)学習検体を用い診断システムを作る。2)cross−validationで最も良い遺伝子発現予測アルゴリズムを選択する。3)テスト検体で評価する。癌の研究では、leave−one−out cross−validationが頻用される。論文でよくある間違いはとしては、予測アルゴリズムだけcross−validationを行っていることである。
(最後に)
我々の行ってきた成果としては、乳癌・大腸癌などの予後判定・乳癌に対するドセタキセルの感受性・甲状腺濾胞癌と濾胞腺種の鑑別などがある。