2月26日のGenomeWebに、AGBTでのロングリードに関する記事が出ていたのでシェアします。
At AGBT, Researchers Describe Using Long Reads for Clinical Applications
この記事は、有料です。ですが、せっかくPacBio関係のことも書いているので、要約をまとめてみました。少し割愛した部分もあります。
最初の方はもう皆さんおなじみ、Icahn School of Medicine at Mt. Sinaiの話です。
「Mount SinaiのRobert SebraたちのラボにあるNGSは、7台のHiSeq 2500/4000、2台のMiSeq、10台のIon Proton、5台のS5、2台のPGM、3台のPacBio RSII、そして2台のSequel!
このほか10XやFluidigm C1などもあり、IonサンプルプレップのChefは11台。
Sebra曰く "全ての個人は2500塩基以上の長さの構造多型を約1000個持っている。これらはショートリードで検出することは難しい"
彼はNGS、特にPacBioをクリニカルの分野に応用するのに意欲的です。
例えば、CYP2D6遺伝子、これは代謝系の20~25%を担う重要遺伝子ですが、非常にPolymoriphicでPseudogeneもありCopy数バリアントの存在も、解析を複雑にしていました。ここには100を超えるスターアレル、つまり個人ごとに、ある種の薬の代謝能力に影響するアレルが存在します。
このアレルを個人ごとに決定することは、SNPフェージング(注:ここでは同一染色体上に数キロ離れて存在するSNPのハプロタイプを決定することの意味)を正確に判定することになり、これは非常に重要です。なぜならそれによって、代謝できる薬の量などを個人ごとに分ける必要があるからです。
Mt.Sinaiのチームは、ロングレンジのPCRで増やしたCYP2D6遺伝子をPacBioで読み、この問題に挑戦しました。
また、3kbから6kbのPCRアンプリコンをデザインし、BRCA1とBRCA2の遺伝子を完全に読むことも行なっています。現在Exonのみにバイアスがかかった既存のデータ以上の新規なことを見つけること、そして臨床診断に活かすこと、を目指しています。
彼らがロングリードで見つけたInDelの多くは、Ionのアンプリコンパネルではデザインされていないもので、現在検証が続いているとのこと。
Uppsala Universityには、HiSeq X Tenと、17台のHiSeq2000/2500、3台のMiSeq、1台のNextSeq、2台のPacBio RSII、そしてこの春はSequelが入る予定のコアラボがあります。ここでもRSIIのクリニカル応用を目指したアプリケーション開発が行なわれており、慢性骨髄性白血病患者におけるBCR-ABL1融合遺伝子検査方法が完成しました。
この遺伝子融合を持つ患者は、イマチニブで治療可能です。しかし同時に、融合遺伝子の中に変異があると薬が効きません。この効かないタイプの変異を見つけるには、従来サンガー法しかありませんでしたが、感度が低いのが難点でした。
そこで、RSIIを使用して感度の高い検出方法が開発されました。
融合部位を含む1.6kbのPCRアンプリコンをデザインし、PacBioで10000倍のカバレッジで読みます。これにより、ある患者さんでサンガーでは検出できないほど低い変異があっても、PacBioでは確実に検出でき、そして数ヶ月が経てばPacBioで検出された変異は確かにサンガーでも検出できるほどになりました。100人の患者さんで試し、100%のConsistencyを示しました。
Rocheグループ傘下のGenentech社では、これまでショートリードをメインに使ってきた診断ビジネスで、PacBioのロングリードにも注目している。
彼らは、中皮腫の症例における遺伝子SFB1のスプライシングを決める変異を、PacBioのIso-Seqを使って発見しました。さらにがん抑制遺伝子に影響を与えるスプライス変異も見つけたそうです。
さて、Oxford Nanoporeも含めたロングリードは、感染症の診断と追跡にはどのように使われるのでしょう?
Birmingham大学のNick Lomanは、彼のラボを、西アフリカでのエボラ感染が疑われる患者サンプルをシークエンスするための、MinIonリアルタイムプラットフォームと呼んでいます。彼らは、新鮮な採血サンプルから2kbのリードを読み、ウイルスの変化や感染経路を明らかにすることができました。今までギニア、シエラレオンそれぞれ別の感染源があるといわれていましたが、彼らとその共同研究グループは、これら2つはお互い国境を越えて交わりあっていたことがわかりました。142サンプルを使ったこの研究の結果は、今月
Natureに発表されています。
UC San DiegoのBen Murrellらは、HIVウイルスのENV遺伝子をPacBioで読んでいます。ENV遺伝子は非常に変化に富んでいてシークエンスはチャレンジングですが、唯一表面に出るたんぱく質で、患者の中には抗体を持つこともあります。
MurrellらはENV領域を、PacBioでシークエンス、CCSで深く読むことにしました。
さらに患者さん(特に抗体を作った患者さんに注目しながら)を時系列で追っていき、その時々でENV遺伝子を読み、どのような進化を遂げるのかを配列から観察、ワクチンをどうやって開発したら良いかを研究しました。」
うーん、ロングリードが診断に応用できるのは間違い無いですね。
もちろん、コストという大きな壁が存在しますが、これはNGS全般に言えること。
一旦アプリケーションプロトコルが確立されれば、半自動でロボットがサンプル調整などを行なって、コストや手間は格段に下がるはずです。
ここまで至るには、アメリカでもあと1年、かかるでしょうか。しかし確実に、その時代は来ています。
さて、PacBioのABGTワークショップの様子ですが、
YouTubeにアップされていますので誰でも観ることができます。
先のMt. Sinai、Uppsala大学、UC San Diegoの発表もあります。というか、Genome Webの記事も、かなりの部分、このワークショップの内容なんですがね。