PacBioのシークエンス無しにデノボアセンブリの発表をすると、オーディエンスから「何でPacBioを使わなかったの?」と聞かれる始末。
これはPAGのあるセッションで私が実際に目にした事実です!
5年前は、精度がどうの言われていたので、それからすると感慨深いなあ。
とは言ってもコストの問題やゲノムサイズの大きさで言うと、PacBioだけのシークエンス&アセンブリで完結できる生物種は、少なくともPAGに登場する生物の中では少ないようです。
そんなときに使われるのが、最近良く話題になっている新しいスキャフォルドの方法。
今回のPAGで登場したのは
- BioNano Genomics社のIrys
- Dovetail Genomics社のChicagoメソッドとHiC
- Phase Genomics社のHiC
- NRGene社のDeNovoMAGIC
このうちDovetailとNRGeneのセミナーには参加してきました。
上記の前提として、PacBioやショートリードで読んだ配列のContigが既にあります。
そしてこれらのContigの、向きと並びをそろえて真ん中をNで埋める、いわゆるScaffoldを作るのにこれらの技術が使われているのです。
BioNanoのテクノロジーは前も紹介しましたね。
Physical Mappingという技術でゲノム上の特定塩基だけを認識してラベリングし、DNAがナノチェンバーを通過する際に蛍光を検出、特定塩基のあった場所のゲノム上の位置情報を出力します。
100Mb以上の長いきれいな(Nickの無い)ゲノムDNAを用意するのがミソで、これが出来ないと蛍光が間違った場所についてしまい、データがダメになってしまいます。
でもうまくきれいなDNAを取れれば、ゲノムアセンブリの結果がとても向上するみたいです。
Complex Genomeのセッションで、Maize GenomeのB73リファレンスゲノムを作った話の中、PacBioとIrysが使われていました。
- PacBioはP6-C4でx65
- Irysはx60のマップ情報(100kbあたり11マップ)
PacBioデータをFalconでアセンブリしたあと、IrysマップでスキャフォルドしてPseudoChromosomeを作った発表でした。
ちなみにPacBioだけからのContigは、平均して5つのBACクローンの配列をカバーしていたそうです。
PacBioで配列レベルを明らかにし、IrysでContigの向きと順番をそろえたということ。
20本の染色体のうち14本で、180箇所のテロメアリピート領域を配列レベルでしっかり読めたという話でした。これはPacBioがすごかった話。
もうひとつはSolanaceae、ナス科のナス属のアセンブリの話で登場していました。
ショートリードのアセンブリではN50がどうやっても650kbしかいかなかったそうですが、Irysデータを加えたらMbレベルになったそうです。
遺伝子数は、いろんな報告があるそうですが、35,000くらいだそうです。ヒトより多い。
それはそうと、ナス科の植物はやたら種類が多いそうですね。
ジャガイモ、ピーマン、トマト、トウガラシ、タバコ、ホオズキ、そしてナス。
さて次は、Dovetail、HiC、Phase、NRGeneについてです。お楽しみに。
0 件のコメント:
コメントを投稿