2016年6月26日日曜日

第4回アジア・ユーザーミーティング



今年も6月8日~10日まで、シンガポールのGrand Copthorne Waterfront Hotelにて、PAG Asiaが終わったタイミングでPacBio Asiaユーザグループミーティングが開催されました。

毎年参加者が増えて、今回は160人余り。
日本からも8名ほどが参加されました。


今回は第4回ですが、第1回から参加していると、明らかに発表の内容が変わってきているのがわかります。
例えば第1回は、これからどんなことをやっていくか、といったビジョンの紹介と、RSを使って読んでみたデータの紹介がメイン。
まだこれから、という感じはしましたが、少人数のアットホームなユーザーミーティングでした。

第2回からは、いよいよ本格的なアセンブリ結果の発表がメインになってきます。
とはいってもアジアはまだバクテリアゲノムのプロジェクトが多く、大量にセルを流して大型ゲノムに挑戦というのはこれからのような感じでした。

第3回になると、アジアからも真核生物はじめ、大型ゲノムのデノボアセンブリの発表が増えてきます。
サンプルプレップやデータ解析のスポンサー企業からの発表も目立ち始めます。

そして今回の第4回、バクテリアからウイルス、HLA、植物や魚類、哺乳類ゲノムまで、幅広いテーマの発表が相次ぎました。

「PacBioで読んでアセンブルをすると、ショートリードで行なうよりも圧倒的に長い配列(Contig配列)が得られる」
というのは毎度毎度で聞き飽きたかと思いますが、PacBioのユーザミーティングなので、こういう話は良く出てきます。
でも今回はいままでよりちょっと変わってきたかなあ、という印象を持ちました。

大型ゲノムのアセンブリの場合、例えば3Gb程度の哺乳類を、PacBio で読んたとします。
平均リード長=12kb、サブリードでは125x のデータが得られた。
これをCanuまたはFalconでアセンブリしても、Contig数はそれぞれ3160本、4912本。
Contig N50 は、9.6 Mbp

これだけでも十分すごいんですが、数千本のContigをもっと減らすには、やっぱりScaffolding技術が必要になってくると思います。
前回紹介した、Dovetail社の技術も、こういうときにつかわれていました。
Scaffoldは、10X Genomics のところでも書きましたが、Contig(連続配列)ではありません。
Contigの並びをそろえる、順番を決める、というような目的に使われます。
Dovetail以外にも、BioNanoのPhysical Mappingも使われていました。
そんなふうに、大型ゲノムのアセンブリプロジェクトは、

  1. PacBioで50x以上読んでFalconアセンブリして、超長いContigを作る
  2. DovetailやBioNanoでScaffoldingする
というのが、(今回のユーザーミーティングを見た限りでは)、今後デフォルトになる気がしました。



ところで今年のシンガポールは、例年より蒸し暑かった。
特にユーザーミーティング期間中は夜も暑くて、日本人の方にはこたえたでしょう。
でも、金曜の夜は涼しくなったんですよ。1日ずれてくれたら良かったのに!

0 件のコメント:

コメントを投稿