2015年7月8日水曜日

NGS現場の会で思ったことと、ヒトゲノムのアップデート

梅雨ですねえ。毎日雨が降っています。
そんな中、先週つくばで「NGS現場の会・第4回大会」が行なわれました。
私たちは、初日にスポンサーセッション、2日め3日めは展示会場とポスターで、楽しみながら仕事してました。

いつもプレゼンを作るとき、観客が100人、200人の場合、どのレベルに合わせて話すかで迷います。
集客をたくさん取るにはできるだけインパクトのあるタイトルと、わかりやすい内容の要旨、が必須。
現場の会で集まる皆さんは、NGSのプロから初心者、研究対象もバラエティに富んでいる。
そこで難しいのは、まず話す内容のレベルです。

PacBioを知らないひとにHGAPとかSubreadとかいきなり言っても通じるわけが無く、眠ってしまうのがオチ。
反対に、あまり初歩的な内容を話すと、今度はNGSのプロでPacBioに精通しているひとが退屈してしまう。
だからといって平均的なレベルの内容では、面白みが無い。

そう、だから、企業がやるプレゼンは大抵つまらないのです!!
みなさん、企業プレゼンで退屈した経験は多いでしょう?
そうならないために、各社、その道の有名研究者を講師に招いて、喋ってもらったりする。

企業としても研究者に喋ってもらった方が楽だし、リップサービスで自社の製品を褒めてもらえれば説得力が出る。
私も、日本進化学会とかゲノム微生物学会とかのランチョンセミナーでは、大学の研究者にお話ししてもらいましたが、「現場の会」「・・・若手の会」では私自身で喋るようにしています。

自分にとっても良い経験になります。
普段は特定のお客さん相手、または同じような研究をしている方相手の「真面目な」プレゼンが多いですが、現場の会、若手の会は、「ここまでなら許されるかな?」的に冒険できる。

ストーリーを作って、観客を飽きさせない。たまに外すこともありますが。

そんなプレゼンの中で、今回は

  • はじめに(これまでの3年を振り返り)
  • PacBioシークエンスとは(初心者向けに簡単におさらい)
  • ヒトゲノムへ与えた衝撃(最近のヒトゲノムシークエンス)
  • ターゲットキャプチャーシークエンス(NimbleGenプローブを使ったキャプチャーシークエンス)
  • 2015年からこの先の計画(さらなるロングリードを実現するためのアップデート)

の流れで話しました。

特に、発表の前日、PacBioを使ったヒトゲノムデノボアセンブリの論文がPublishされました。
これは話題に入れないとダメだ、と思い、深夜1時過ぎまでスライドを更新していました。

その論文がこれ
あの、Mount Sinaiのチームの仕事です。
2014年、アキバでPacBio現場の会、をやりましたがその時の演者の1人、Bobbyさんの講演を覚えている方は、「ああ、あの仕事がついに!」と思ったのではないでしょうか。

彼らは、今までのショートリードとPacBioリードというハイブリッドアセンブリの概念を覆す、新しいハイブリッドアセンブリを行なっていました。
彼らのは、PacBioロングリードと、BioNanoゲノムマップによるハイブリッドアセンブリ。

BioNanoのテクノロジーは今日はあまり詳しくは書きませんが、ゲノム上に特定の短い配列があるとして、ゲノム抽出後にそれを酵素が特異的に認識、蛍光を付け、そのDNAフラグメントを機械にかけて蛍光を検出します。
そうすると、ゲノム上のその特定塩基配列があった場所が蛍光でわかります。
ゲノム配列全体がわかるのではなく、特定認識配列があった場所の情報(ゲノムマップ)がわかるというわけ。

この論文を読むときは是非、Supplement 1も手元にあったほうが手順がわかりやすいです。


彼らはHapMapのDiploidヒトゲノム・NA12878を、P5-C3で合計46x読んだ。
そしてBioNanoでは80xのゲノムマップを読んだ(平均278kb)
PacBioデータはエラー補正後、Celera Assembly またはFalcon Assemblyした。
BioNanoのマップデータは一度アセンブリし、Scaffoldを作る。
そのScaffoldにCelera Assemblyで作ったContigをアラインし、Scaffoldにシークエンスデータを足す。Scaffold v1ができる。
Scaffold v1に、Falcon Assemblyで作ったContigをアラインし、Scaffold v2を作る。

こんな感じでScaffoldをきれいにしていって、ヒトゲノムを構築していった。

最終的には、Scaffoldが202本、NG50 はなんと28.8Mb!!
これは驚き、というか衝撃!

もちろんここから、構造変異を見つけていくわけです。

彼らの目標は、リファレンス配列並の高精度のゲノム配列を、いかに簡単に今あるテクノロジーでつくること。
BioNanoは技術的にはPacBioと全く異なりますが、うまく両方使えば他のどのテクノロジーでもできないようなことを可能にする、そんな論文です。

もちろん、このようなアセンブリは、BioNanoだけ持っていても不可能です。
BioNanoとショートリードでも無理でしょう。
PacBioが絶対に必要です。

0 件のコメント:

コメントを投稿