2015年7月18日土曜日

PacBio Asia User Group Meeting 速報


今年も、PacBioアジアユーザーグループミーティングが行なわれました。
場所は去年と同じ、シンガポールのGrand Copthorne Waterfront ホテル。
ここはANAのCAさん御用達のホテルなのです。
ANAの制服のままのCAさんとホテルのエレベーターで一緒になるとドキッとしますね。
いろんな意味で(笑)。

さて話をユーザーミーティングに戻すと、今回は第3回、参加人数は昨年の2倍近い140名!
規模が大きくなった分、以前のようなアットホームさは無くなりましたが、これも成長しているということでしょうか。

今年、存在感を増していたのが韓国チーム。
韓国からは、受託会社のマクロジェン、DNALink、バイオンフォ受託会社のChunLab、の3社が発表。
マクロジェン社は皆さんご存知、韓国人AK1ゲノムをリファレンスレベルクオリティで完成させることを目標に、HiSeq X10システム、RS II2台、をフル稼働させてシークエンスしている会社です。
AGBTのときの発表よりもデータを増やしていました。

DNALink社は、アジアで最初のPacBioを導入した会社です。ここはマクロジェンよりPacBio経験が長いので、実績は多い。
面白かったのが朝鮮半島の東西南の海岸で採取したサンプルでメタゲノム解析を行い、Pacならではのメタメチレーション解析を試みた、という話。
バクテリアのメチレーションのパターンが地域で違う、ということで、他の機械ではできない解析だなと思いました。結論をどうもっていくのか、論文が見ものです。

マクロジェンもDNALinkも、ライバル同士がお互い発表し合い、それぞれ認め合うような、そんな雰囲気でした。

もう1社のChunLabは、今月初めのNGS現場の会でも参加していましたね。
ChunLabは、バクテリアの16S配列をPacBioで完全長読んで、それをもとに種のレベルの分類を可能にする解析パイプラインを提供しています。
ここで、発表者のChun社長は、「16Sを完全長で読んだ場合、一番大事なことはPCRキメラを取り除くこと」と言っていました。
実際にPCRで全長16Sを増幅すると、かなり(多いときは20%も!?)キメラ配列が作られるらしい。
そのキメラ配列を取り除くために、既知の正しい16S配列のデータベースを整備し、その配列と比較することで確からしい配列を判別し、キメラ配列を取り除いているそうです。
確からしい配列のなかには新規の16Sがあるので、それは新たにデータベースに追加される。
そうしてどんどんデータベースが更新されて、キメラ配列除去の精度も上がる。
興味のある方はこちら
でも、アジアには競合がとても多いらしいです。

さて、そのほかにもオランダのバイオテック、Key Gene社は、4倍体の綿など植物ゲノムをPacBioでデノボアセンブリ。
マレーシア大学では天然ゴムを分解するActinomycetes(GCリッチ)をゲノムアセンブリ。
Acceligen社はLivestock(何て訳すのかな)ゲノムの話しの流れで、ヤギのゲノムアセンブリの話。
Arizona Genome Instituteからは、複数BACを一度にシークエンスした話。10個のクローンを1つのSMRT Cellでシークエンスして、10個のContigに。
使ったのはHGAP3のみでインデックス使用していないって!?
その10個がどれくらい違う配列なのか、それにもよるのでしょうが、もう少し聞きたいところ。
早く論文になって欲しい。

今回、大型ゲノムのアセンブリの発表で、BioNanoとのハイブリッドアセンブリがいくつかありました。
確実に来年は、もっと増えてスタンダードになっていることでしょう。
BioNanoは前にも書きましたが、ゲノムマッピングの情報を出してくれます。(配列をマップするの意味では無いです。地図の意味です)
そのマップ情報と、PacBioの配列情報を組み合わせれば、アセンブリにはかなり強い!
でも、やっぱりLife Is Not So Easy!!
BioNanoとPacBioのContigが矛盾することもあるそうで、そういうところは何が起こっているのか、詳しく見ていく必要があるでしょう。


お待たせしました。我が日本からは、内藤さんが登場!
140名が釘付け
Wild Vigna !  
いつものトークでアズキたちのすごさが十分伝わりました。
内藤さん、ありがとう!
最後のSexy、うけてました!

終わってからPacBio Asiaの人から、「日本人研究者って、面白くてエネルギッシュな人が、実は多い?」と聞かれました。ちなみに去年は、阪大微研の中村さんでした。
「若い研究者はね」


皆さん、お疲れ様でしたー
また来年、シンガポールでお会いしましょう!



ちなみに、ツイッターでは
#ugmAsia でミーティングの模様が若干ですが、ツイートされていました。




2015年7月8日水曜日

NGS現場の会で思ったことと、ヒトゲノムのアップデート

梅雨ですねえ。毎日雨が降っています。
そんな中、先週つくばで「NGS現場の会・第4回大会」が行なわれました。
私たちは、初日にスポンサーセッション、2日め3日めは展示会場とポスターで、楽しみながら仕事してました。

いつもプレゼンを作るとき、観客が100人、200人の場合、どのレベルに合わせて話すかで迷います。
集客をたくさん取るにはできるだけインパクトのあるタイトルと、わかりやすい内容の要旨、が必須。
現場の会で集まる皆さんは、NGSのプロから初心者、研究対象もバラエティに富んでいる。
そこで難しいのは、まず話す内容のレベルです。

PacBioを知らないひとにHGAPとかSubreadとかいきなり言っても通じるわけが無く、眠ってしまうのがオチ。
反対に、あまり初歩的な内容を話すと、今度はNGSのプロでPacBioに精通しているひとが退屈してしまう。
だからといって平均的なレベルの内容では、面白みが無い。

そう、だから、企業がやるプレゼンは大抵つまらないのです!!
みなさん、企業プレゼンで退屈した経験は多いでしょう?
そうならないために、各社、その道の有名研究者を講師に招いて、喋ってもらったりする。

企業としても研究者に喋ってもらった方が楽だし、リップサービスで自社の製品を褒めてもらえれば説得力が出る。
私も、日本進化学会とかゲノム微生物学会とかのランチョンセミナーでは、大学の研究者にお話ししてもらいましたが、「現場の会」「・・・若手の会」では私自身で喋るようにしています。

自分にとっても良い経験になります。
普段は特定のお客さん相手、または同じような研究をしている方相手の「真面目な」プレゼンが多いですが、現場の会、若手の会は、「ここまでなら許されるかな?」的に冒険できる。

ストーリーを作って、観客を飽きさせない。たまに外すこともありますが。

そんなプレゼンの中で、今回は

  • はじめに(これまでの3年を振り返り)
  • PacBioシークエンスとは(初心者向けに簡単におさらい)
  • ヒトゲノムへ与えた衝撃(最近のヒトゲノムシークエンス)
  • ターゲットキャプチャーシークエンス(NimbleGenプローブを使ったキャプチャーシークエンス)
  • 2015年からこの先の計画(さらなるロングリードを実現するためのアップデート)

の流れで話しました。

特に、発表の前日、PacBioを使ったヒトゲノムデノボアセンブリの論文がPublishされました。
これは話題に入れないとダメだ、と思い、深夜1時過ぎまでスライドを更新していました。

その論文がこれ
あの、Mount Sinaiのチームの仕事です。
2014年、アキバでPacBio現場の会、をやりましたがその時の演者の1人、Bobbyさんの講演を覚えている方は、「ああ、あの仕事がついに!」と思ったのではないでしょうか。

彼らは、今までのショートリードとPacBioリードというハイブリッドアセンブリの概念を覆す、新しいハイブリッドアセンブリを行なっていました。
彼らのは、PacBioロングリードと、BioNanoゲノムマップによるハイブリッドアセンブリ。

BioNanoのテクノロジーは今日はあまり詳しくは書きませんが、ゲノム上に特定の短い配列があるとして、ゲノム抽出後にそれを酵素が特異的に認識、蛍光を付け、そのDNAフラグメントを機械にかけて蛍光を検出します。
そうすると、ゲノム上のその特定塩基配列があった場所が蛍光でわかります。
ゲノム配列全体がわかるのではなく、特定認識配列があった場所の情報(ゲノムマップ)がわかるというわけ。

この論文を読むときは是非、Supplement 1も手元にあったほうが手順がわかりやすいです。


彼らはHapMapのDiploidヒトゲノム・NA12878を、P5-C3で合計46x読んだ。
そしてBioNanoでは80xのゲノムマップを読んだ(平均278kb)
PacBioデータはエラー補正後、Celera Assembly またはFalcon Assemblyした。
BioNanoのマップデータは一度アセンブリし、Scaffoldを作る。
そのScaffoldにCelera Assemblyで作ったContigをアラインし、Scaffoldにシークエンスデータを足す。Scaffold v1ができる。
Scaffold v1に、Falcon Assemblyで作ったContigをアラインし、Scaffold v2を作る。

こんな感じでScaffoldをきれいにしていって、ヒトゲノムを構築していった。

最終的には、Scaffoldが202本、NG50 はなんと28.8Mb!!
これは驚き、というか衝撃!

もちろんここから、構造変異を見つけていくわけです。

彼らの目標は、リファレンス配列並の高精度のゲノム配列を、いかに簡単に今あるテクノロジーでつくること。
BioNanoは技術的にはPacBioと全く異なりますが、うまく両方使えば他のどのテクノロジーでもできないようなことを可能にする、そんな論文です。

もちろん、このようなアセンブリは、BioNanoだけ持っていても不可能です。
BioNanoとショートリードでも無理でしょう。
PacBioが絶対に必要です。