皆さん、パイナップルって、よく食べます?(私はたまーにしか食べません)
日本では、リンゴやブドウほどメジャーではないせいか、パイナップルの品種名って、あまり知らないですよね。
八百屋やスーパーでも、普通に「パイナップル」だったりするし。
恥ずかしながら、今日まで、パイナップルにたくさんの種類があるなんて気にしたこともありませんでした。
サイトはこちら
世界で一番多く栽培されているのが、Smooth Cayenne(スムース・カイエン)種だそうです。
でも今、MD-2、別名ゴールデン・パイナップル、スーパー・スイート、などと呼ばれている品種が次々と栽培されているらしい。
時は1961年、ドール社、デルモンテ社、マウイ・パイナップル・カンパニーの出資によって、ハワイ州に、Pineapple Research Institute(PRI)が設立されました。
そこで品種改良によって生まれたのが、このMD-2品種。MDの名は、パイナップル・カンパニーのゼネラルマネージャーの妻の名前、Millie Dillardさんに由来するそうです。
(以上、UTAR AGRICULTURE SCIENCE JOURNAL ● VOL. 1 NO. 4. OCTOBER 2015からの情報でした)
パイナップルって、今まで考えたことなかったのですが、受粉しなくても果実を作るそうですね。
Parthenocarpy(単為結果)と呼ぶそうです。バナナと同じ。
そして、non-climacteric な植物。
これは、果実を収穫してからエチレンガスをほとんどあるいは全く出さないので、収穫後に果実が熟すことはないらしい。ここのサイトが詳しい。
そういえば、収穫後にエチレンガスを噴霧して、食べ頃をコントロールする話は、昔聞いたことがありました
そんなパイナップルですが、MD-2のドラフトゲノムが論文になりました。
Biotechnology Research Institute, University Malaysia Sabah の、Dr.Redwan らの仕事です
PacBioを使ったアセンブリプロジェクトです。
ここではイルミナリードも使われていますが、目的はPacリードのエラー補正と、Pacアセンブリ後のContigの、Scaffoldingのみです。
先ず、イルミナライブラリ用に350bpと550bpのインサートを作り、HiSeqを使って100bpのシングルまたはペアエンドシークエンス。
さらに、750bpのインサートをMiSeqを使って300bpのヘアエンドシークエンス。
Q20のクオリティ、最低50bpのリードを解析に使用して、154.7カバレッジのデータ量を得た。
PacBioは20kbライブラリ、P4-C2、P5-C3で32セルシークエンス。
フィルタリング後の11.78Gbデータを、イルミナの350pb、750bpライブラリデータで補正。
これには、novoLR package(Novocraft ソフトウェア)を使用。
補正後のデータは8.34Gb(15.9 x)になったので、これをCelera Assemblerにかけてアセンブリ → N50 = 25,277bp
Contigの冗長性を除くため、25,000bp以下の短いContigをそれ以上の長いContigにマップして80%以上のContigを除いたり、エラー補正後のリードをContig配列にマップしたりして16%冗長配列を除いている。
このような努力の結果、トータルのContigサイズは想定ゲノムサイズの 96.6% の 508 Mb、N50 は34,762 bpになった。
このようにして作られたContigは、次にイルミナリード、補正前のPacBioリードを利用して、novoLRpolishというソフトでScaffoldingし、N50 が153,084bp、最大Scaffoldが1.29Mbになり、トータル塩基数は524Mbpになった。
アセンブル後のゲノム配列の評価には、CEGMA(Core Eukaryotic Genes Mapping Approach)というツールを使っている。
簡単に言うと、真核生物に存在するコアな遺伝子たちがちゃんと読めているか、を評価するデータツールです。
しかし、残念ながら、CEGMAは昨年サービスを中止したらしいです。
これからはBUSCO(Benchmarking Universal Single-Copy Orthologs)らしいです。
さてさて、もうひとつ今日驚いたこと。
パイナップルの果肉は、果実じゃない!
ちなみにパイナップルを使った料理のレシピは、クックパッドによれば、現在6,000種類以上もあります!!
こちらも驚き!
0 件のコメント:
コメントを投稿