2016年4月19日火曜日

Seabassゲノムついに論文に!

大型ゲノムのシークエンスと言っても、魚類はあまり聞きません。
単に私が知らないだけかもしれませんが。
フグは昔から有名ですね。でもそのほかの魚類、マグロとかサンマとか、マンボウとかジンベイザメとか。実はシークエンスされているのかな。

そんな中、Seabass「スズキ」のシークエンスが、アジア国際チームによってPacBioでずいぶん前から読まれていましたが、ついに論文になりました!


PLoS Genet. 2016 Apr 15;12(4):e1005954. doi: 10.1371/journal.pgen.1005954. eCollection 2016.
Chromosomal-Level Assembly of the Asian Seabass Genome Using Long Sequence Reads and Multi-layered Scaffolding

これ、結構前からプレゼンでは良く見かけていたました。
なんと、XL-C2とかの時代からシークエンスしていたのです!
懐かしいなあ。3年ひと昔

スズキのゲノムは約700Mb、DiploidのA Chromosome(2n=24)と、いろんな数(2-10)のB Chromosomeがあるとのこと。

Brain由来のゲノムはXL-C2、120分Movieで77セル
Kidney由来のゲノムはP5-C3、180分Movieで105セル
合わせてゲノムサイズの90x分のデータを取得して、アセンブリにかけたそうです。

同時にHiSeqでも読んでいて、こちらは500bpまたは700bpインサートのペアエンドで、80x分のデータを取得。

アセンブルは、HGAPを使ったもの(V1)、その後HiSeqデータを足してScaffoldしたもの(V2)、さらにOpGenのPhysical Mapping情報やリンケージマップ情報などを足して最終的に完成させた染色体レベルの配列(V3)を完成させています。
私がこれを2年くらい前にユーザミーティングで初めて聞いたとき、PacBioだけのアセンブリでN50 が1Mbを超えているのがすごい!と思ったのを覚えています。
今はそれがそんなに珍しくなくなってきましたけどね。

ですがこの論文を読むと、ゲノムアセンブリとその後のデータバリデーション、遺伝子アノテーション、がいかに大変かがひしひし伝わってきます。
とても詳しく手法について述べているので、参考になる点も多いと思います。

今だったら、P6C4で読んで、Falconでアセンブリするんでしょうねえ~、なんて思ったりもしましたが。

ところで6月8日~10にかけてシンガポールで行なわれるアジアPacBioユーザミーティングに、このSeabassプロジェクトの研究者からも発表がある予定です。
先日のゴリラゲノムの記事にも書きましたが、ユーザでなくてもPacBioに興味がある研究者なら、参加可能です!
その際は前もってお知らせください。私からPac本社にOK出しますので。


PacBioでシークエンスされている魚類、そういえば、ノルウェーのチームが、ニシンか何かを読んでいました。今思い出した!

0 件のコメント:

コメントを投稿