2022年

  • トップ
  • >
  • 研究活動
  • >
  • 主要研究成果
  • >
  • 2022年
  • >
  • 杉原 礼一、加藤 有己 ≪神経遺伝子学≫ シングルセル高精度比較解析アルゴリズムを開発 ~細胞時系列比較により疾患関連遺伝子を同定する新技術~

杉原 礼一、加藤 有己 ≪神経遺伝子学≫ シングルセル高精度比較解析アルゴリズムを開発 ~細胞時系列比較により疾患関連遺伝子を同定する新技術~

2022年10月14日
掲載誌 Nature Communications

図1. 分岐を含む細胞集団の疑似時系列比較アルゴリズム
クリックで拡大表示します

研究成果のポイント

  • 細胞集団が時間的に複雑に変化する過程をシングルセルレベルで比較できる新規アルゴリズムを開発
  • これまで比較すべき細胞集団において、枝分かれのない時系列を個別に選択する必要があったが、 効率の良い分岐構造の比較法を実装することで、高精度の比較解析が一度に可能に
  • コンピュータでグローバルな細胞時系列データを比較することにより、事前知識を用いた手法では 見つからないような疾患関連遺伝子が同定され、医療への応用に期待

概要

大阪大学大学院医学系研究科の加藤有己准教授、 大学院生の杉原礼一(博士課程)(神経遺伝子学)らの 研究グループは、様々な経過時間の細胞が含まれる遺 伝子発現データセットのペアに対し、疑似的な時系列 (疑似時間※1)に沿って分岐を含めてシングルセル比較解析※2を行う計算手法 CAPITALを開発しました(図1)。

これまで、細胞の分化※3など多くの場合、分岐を含む細胞動態を解析するための疑似時系列比較は、解析者が事前知識を使って直線の経路を1つずつ選択する必要があり、コンピュータによる自動化は実装されていませんでした。

今回、研究グループは、計算機科学の分野で提案されていた木のアラインメント※4を適用することにより、分岐のある木構造に対する疑似時系列シングルセ ル比較解析を行うツール CAPITALを開発しました。これにより、比較すべき最適な分化経路がアルゴリ ズムにより決定されるため、精度向上が見込まれます。例えば、データ1としてある疾患患者の、そして、デ ータ2として健常者の遺伝子発現データを取り、CAPITALを実行することで、これまで検出できなかった 疾患関連遺伝子の同定につながり、医療分野への応用が期待されます。

研究の背景

生体組織や器官はさまざまな細胞の集団から構成されていますが、それらで発現している遺伝子の種類や量を細胞1つ1つに分解して調べることができるようになりました。細胞は分化という過程を経て最終的な形になり、それぞれの機能を発揮しますが、遺伝子発現の経時変化を確認することが重要です。例えば、正常なマウスと病気のマウスから取得したシングルセル遺伝子発現データセットのペアを比較することで、病気を制御する遺伝子は何かといった疑問を、コンピュータを使って解明することができると考えられます。

細胞分化には時間軸に沿って枝分かれする過程が含まれることが多く、これまでのシングルセル比較解析では、解析者が事前知識を使って1つの直線の経路を選択する必要がありました。もちろん、すべての組み合わせをしらみつぶし的に調べ、最適な組み合わせを選べばよいのですが、計算時間がかかってしまいます。一方、互いに関連のある2つのシングルセルデータセットを先に統合し、互いのデータに共通の分化経路を計算することで、分岐を選択する問題を回避することも可能ですが、統合により元の経路情報が適 切に保存されない可能性がありました。

研究の内容

加藤准教授らの研究グループでは、遺伝子発現が類似している細胞部分集団(クラスター)を要素とした木構造の経路をあらかじめ計算し、それらをアラインメントするアルゴリズムにより、シングルセル比較解析ツー ルCAPITAL (comparative analysis of pseudotime trajectory inference with tree alignment)を開発しました。分岐が複数箇所出現するように設計された 2,278 個の合成データセットのペアを用いて、先述のデータ統合手法による複数の最新手法と網羅的に比較したところ、CAPITAL が統計的に有意に経路(時系列)情報を保存してアラインメ ントできることを示しました(図2)。

次に、異なる研究で得られたヒトの骨髄細胞の遺伝子発現データのペアに対し、CAPITALを用いてシングルセル比較解析を実施しました。当該データには造血幹細胞から赤血球や単球など分化した細胞までが含まれ、時間軸に沿って分岐を多く含むことが知られています。CAPITAL によるシングルセル比較解析により、たとえデータが異なっていても、互いに同じ細胞型へのアラインメントに成功しました。また、代表的なマーカー遺伝子の発現ダイナミクスが類似していることを確認しました。

さらに、ヒトとマウスといった異なる生物種から得られた骨髄細胞データに対して CAPITAL によるシングルセル比較解析を行い、進化の観点から見た細胞動態の違いを示唆する結果が得られました(図3)。

図2. CAPITAL は最新のデータ統合手法よりも時系列情 報を保存する
クリックで拡大表示します

図3. 造血幹細胞から赤血球への分化経路におけるヒトと マウスの遺伝子 CSF1 の発現の違い
クリックで拡大表示します

本研究が社会に与える影響(本研究成果の意義)

本研究成果により、細胞動態をシングルセルレベルで比較する上で、分岐を含む複雑な分化経路を扱うことが可能となりました。例えば、血液など複雑に分化することが知られている細胞集団に焦点を当て、データ1としてある疾患患者の、データ2として健常者の遺伝子発現データを取り、CAPITAL を適用することで、これまで検出できなかった疾患関連遺伝子の同定につながり、医療分野への応用が期待されます。

研究者のコメント

<加藤有己 准教授のコメント>
CAPITAL 開発当初は計算量に苦労しました。木のアラインメント問題は計算機科学の言葉で言えば問題のサイズの多項式時間で解けるのですが、細胞数が数千個にもなると多大な時間がかかり、実用的ではありません。そこで、現実には数十個と見積もられる細胞クラスター間の木のアラインメントを行うことで、計算量の問題を解決しました。時間情報、構造情報を保存したままシングルセルデータを比較する手法は他に例がなく、本手法が広く利用されることを願ってやみません。

用語説明

※1 疑似時間
生体組織や器官から細胞を採取すると、それ以降完全に同じ細胞を採取できないため、実時間の追跡は不可能である。そこで、同じ組織から採取した細胞集団には様々な時間経過の細胞が含まれると仮定し、それらに対応する疑似的な時間を疑似時間という。

※2 シングルセル比較解析
ある細胞集団を構成する個々の細胞の遺伝子発現量などを観測したデータを使い、互いに関連の あるシングルセルデータ同士を比較すること。例えば、2つのデータの間で発現量に差のある遺伝子 を同定するといった解析を含む。

※3 分化
遺伝子発現の変化により、細胞が特定の細胞型に変化していく過程。

※4 木のアラインメント
比較する2つの木構造において、親子関係などの階層構造を考慮しながら、それぞれを構成する素 (本研究における細胞クラスター) 同士の対応付けを取ること。

特記事項

本研究成果は、2022年10月14日( 金 )18 時(日本時間)に英国科学誌「Nature Communications」(オンライン)に掲載されました。

【タイトル】

“Alignment of single-cell trajectory trees with CAPITAL”

【著者名】

Reiichi Sugihara1, Yuki Kato1,2,*, Tomoya Mori3 and Yukio Kawahara1,2(*責任著者)

【所属】

  1. 大阪大学 大学院医学系研究科 ゲノム生物学講座  神経遺伝子学
  2. 大阪大学 先導的学際研究機構 生命医科学融合フロンティア研究部門
  3. 京都大学 化学研究所 バイオインフォマティクスセンター

      【DOI番号】10.1038/s41467-022-33681-3