2017年4月19日水曜日

Dovetail レタスゲノム論文

すみません、最近ブログ更新をさぼっていました。
私事ですが、年度末に7年ぶりの引っ越しをしまして、そのうえ国内・海外の出張が重なり、ブログのことが後回しになっていました。

引っ越しのタイミングで買うものといえば掃除機。
前の家ではルンバを買ったのですが、今度はダイソンのハンディ掃除機。
これ、凄く良いですね。毎日使ってます。

さて、3月末の育種学会は名古屋でした。
愛知県はキャベツの生産量日本一だそうです。意外ですよね。
キャベツと似たような野菜にレタスがあります。では、
レタスの生産量日本一は?
正解は長野県です。これは、やっぱりね、という感じ?

レタスは学名 Lactuca sativa というそうですが、染色体の数は9対、18本。
ゲノムサイズは約2.5Gb
リピートが多く、植物らしい? ゲノム構造だそうで。

今日紹介する論文は、まだPacBioは出てきませんが、DovetailのChicagoメソッドを使ってレタスのゲノム解読を行った例。これです


このレタスゲノムの場合、ショートリードだけで行ったドラフトアセンブリのN50は、
コンティグレベルで36kb
スキャフォルドレベルで476kbでした。

これが、HiSeq 2レーン分のシカゴライブラリデータを加えただけで、スキャフォルドN50 が1.8Mbになったというのだから驚き!

”The Dovetail technology greatly increased the contiguity of the assembly, assimilated additional scaffolds into chromosomal pseudomolecules, identified chimeric scaffolds that had been missed by genetic analysis, and oriented and ordered scaffolds through complex regions. ”

さらに、この論文には間に合わなかったみたいですが、彼らは追加でもっと凄いデータを出しています。
論文に使われたシカゴライブラリは、およそ150kbのゲノムDNA分子から作られたそうです。
そのあとDovetailでは、400kbシカゴライブラリを作りました(ultra high molecular weight Chicago)。
でそのデータを加えたらN50 は6.51kbに!
さらにさらに、Dovetail Hi-Cライブラリ(細胞内でChicagoライブラリのようなものを作る)も作って追加したところ、9本の仮想染色体を再現できるところまでできたそうです!!

もちろん9本の仮想染色体は、Nを含むスキャフォルドです。
彼は今、PacBioのデータを取得し、ギャップフィリングに挑戦中だそうです。
またさらにHi-Cを追加して、テロメアからテロメアまで、の完全染色体配列の再現を目指しているらしいですよ。

さて、そんなDr. Michelmoreのウェビナーが来月31日にあります。
Dovetail の技術に興味のある方、ギガベースのゲノムアセンブリに苦労されている方、PAG Asiaに行けないけれども情報仕入れたいかた、ぜひ参加ください。
こちらから登録

と、誘っておきながら、時間が悪いんですよね。なので録画が予定されています。
登録者にはリンクが行くはず。
もし参加し忘れた、けど録画が見たい、という方は私まで直接お知らせください。
NGS現場の会でも、Dovetailのセッションを企画しましたのでよろしくです!

0 件のコメント:

コメントを投稿