2017年6月15日木曜日

New Maize Reference Genome 出た!

問題です! 
世界三大穀物といえば、コムギ、コメ、そしてトウモロコシですが、
このうち、一番生産量が多いのはどれ?



正解はトウモロコシ
アメリカ農務省のレポートWorld Agricultural Supply and Demand Estimates 2017年6月版によると、2015/2016年確定値では全世界の生産量は、
コムギが 7億3700万トン
コメが 4億7200万トン

トウモロコシはなんと、9億6800万トン(2016/2017年推定値は10億6700万トン!)で断トツ1位。
うちアメリカは3億4600万トンを生産し世界一。
そのほとんどを国内で消費し、4800万トンを輸出しているらしい。
輸出量もアメリカが世界一(2016/2017年推定値は5600万トンだそうです)。

余談ですがこの報告書は、世界最大の農業大国アメリカが、世界の主要農産物についてまとめた統計報告みたいです。私も検索していて見つけたのですが、非常に細かくて驚きました。
もう一つ、日本語のサイトとしては、農畜産業振興機構の海外現地報告がとても情報量豊富です。
トウモロコシではここの「米国におけるトウモロコシ生産の現状」が読んでいて面白かった。
アメリカ国内で、トウモロコシはそれまで飼料用途が一番多かったが、2005年ごろからバイオエタノール用途が急増(法律で一定以上のバイオエタノールを販売することを石油販売業者に義務つけられたため)、今は飼料用とエタノール用が同じくらいらしい。
後はスターチ、食用ですね。でもこれらはほんのわずか(10%未満)。

前置きが長くなりましたが、トウモロコシゲノムが新たに解読され、前のリファレンスよりかなり改善されたバージョン4が、Natureに発表されました。
Improved maize reference genome with single-molecule technologies

これはもちろん、PacBioを使って読んでアセンブリした素晴らしい成功例です。
RSIIのときの仕事です。
B73系統のゲノムDNAは15kb~40kbにシェアリングされ、20kbプロトコルでライブラリ作製。
試薬はP6C4を使用し、6時間Movieでシークエンス。
65カバレッジ分のデータを得て、FalconとPBcR+MHAPのアセンブラーでパラメータを変えながらいくつかアセンブルをしている。
得たコンティグは、Irys(BioNano)のオプティカルマッピングデータに合わせて、スキャフォルディング。
さらにBACデータも使用してPseudomoleculeを作っている
出来たScaffoldのギャップは、もちろんPacBioのロングリードでできるだけ埋めている(PBJelly)。

この仕事の凄いのは、コンティグN50をこれまでの52倍長くしてメガベースにしたのもさることながら、連続配列として、トータル1.2Gbのレトロトランスポゾンの存在を明らかにしたこと。
その約半数は、他のトランスポゾンの中に挿入された「入れ子」状であったという。
これは私の想像ですが、トランスポゾンって、案外ランダムに入るわけでは無いのかもしれませんね。
一度入ったトランスポゾンの中にわざわざ入り込んで、その働きを邪魔するトランスポゾンがあったりして。
何のためか、はわかりませんよ。

ただひとつ、このゲノムプロジェクトで残念なのは、DovetailのChicagoやHi-Cを使っていないこと。
これらを使えばもっと早く結果が出ていたかもしれないし、宣伝に使えたのに(はい、私の都合です)。

この仕事、論文になる前にPacBioとBioNanoのケーススタディとして昨年公開しています。
こちらからダウンロードできるので是非どうぞ。



2017年6月4日日曜日

カベルネソーヴィニヨンのアセンブリでFalcon‐Unzipを知ろう!

皆さんワインは飲みますか?
赤ワイン、白ワイン、私は正直あまり詳しくありません。
飲みやすさと香りで、あとは価格で選んでしまいます。

でもメルローやシャルドネ、という名前を聞いたことはありました。
これらはブドウの品種です。
同じように現在世界中で広く栽培されているブドウ品種に、カベルネ・ソーヴィニョンというものがあります。
これは Sauvignon Blanc という白ブドウと、Cabernet Franc という黒ブドウ品種のF1だそうです。
F1なので、そのゲノムはとてもヘテロ性が高いことが想像できます。


このゲノムをPacBioで読んで、アセンブリした例があります。
PacBioのCase Studyにも紹介されているし、私も何度かこの話題をセミナーなどで紹介しているので聞いたことがあるひともいるでしょう。

ヘテロ性が高い、ということでアセンブラーには Falcon unzip が使われました。

論文はフリーでここから全文がとれます。

Falcon unzipのコンセプトが説明されているので、二倍体ゲノムのアセンブリを考えているひとはまずチェック!
いきなりFalcon unzipの論文に行くよりも敷居が低いと思います。
そしてワインについても勉強できる。知ったかぶりできる、良いペーパーだと思いますよ。

では、次からカベルネ・ソーヴィニョンを飲むときがあったら、ヘテロ性とアセンブリの関係を考えることにしましょう!