2018年7月8日日曜日

「第三世代シーケンサー」とは PacBio のことさー


産経ニュースにPacBioを使ったアセンブリのニュースが載った件

以前、アホロートル(40代以上のひとにはウーパールーパーという名前の方がなじみが深い?)のゲノムがPacBioシークエンサーで解読された、ということをこのブログでも書きました。
それが産経ニュースで紹介されていた、、、って、今更?
俺が書いたの1月だよ、まったく。
いや、これ速報性は求められていないから、って言われたりして。

PacBioのことは名前は伏せて、「第三世代シーケンサー」と書かれています。
まあ、我々は一発でわかりますよね?
「ポータブルシーケンサー」とは書かれていないから、あっちじゃない、ともわかります。


さて、


趣味で始めたこのPacBioブログ:パックマンの挑戦 ですが、6年半で252本の記事を書いてきました。よう続いたなあー
仕事じゃないですからね。完全に自由にやってますので。
途中でやめても良かったんですが、なんかライフワークの一部になってしまって。

そんな「パックマンの挑戦」ですが、今回の記事が最後になります。


誤解の無いように申し上げると、PacBioはまだまだこれからもロングリードシークエンスのグローバルスタンダードとして、発展していきます!
ただ、私がPacBioにたずさわるのが、これで最後という意味です。

今まで楽しみに読んでくれた皆さま、ありがとうございました!

また来月、新しいタイトルのブログが始まりますので、そっちもよろしくお願いします!

2018年7月7日土曜日

コアラゲノム解読!

私が思う、子供の頃から好きなお菓子ベストスリーといえば、
きのこの山、たけのこの里、そしてコアラのマーチです。
共通点は、チョコレート、甘過ぎない、だいたいどこでも売ってるということ。

コアラのマーチのオリジナル(チョコ)に描かれているコアラはおんぶしていますが、実物のコアラはそんなにおんぶしてますかね? 
抱っこの方が多くないかな。カンガルーと同じ有袋類ですし(あまり関係なさそうだけどイメージとして有袋類は抱っこのほうが楽そう)。

そんなコアラのゲノムがPacBioのロングリードで解読されたそうです!!

京都大学のプレスリリース

コアラはユーカリの葉しか食べません。でもユーカリには毒があるから、ほとんどの哺乳類はユーカリの葉は食べられない。
ってことはコアラは食べ物をほぼ独占できるということ!
じゃあなぜコアラはユーカリの毒を解毒できるのか?

Johnson et al., (2018) Adaptation and conservation insights from the koala genome. Nature Genetics

論文では、ゲノムシークエンスはPacBioがメインで使用され、BioNanoでスキャフォルディング、Illuminaで配列エラー補正、しています。

先ずはコアラゲノム(約3.4Gb)の、57カバレッジ分のPacBioデータでFalconアセンブリ。
N50がなんと11.6Mb!
結構行きましたなあ。これはすごい。
Johnson et al., Nat Gen. 2018
たった57カバレッジのデータでN50が11Mb超えなんて、あまり聞いたことがありません。
アセンブリしたゲノムの47%がリピート配列らしいです。
またBUSCO解析の結果、4104個の哺乳類代表遺伝子の95.1%をカバーしていたらしい。

PacBioロングリードの素晴らしさは、repeat-rich long noncoding RNAs のシークエンスとアノテーションが正確にできたということ。
X-染色体inactivation に関わるRSX遺伝子もきちんとFemaleサンプルからのみ発現されていたらしい。

また、代謝酵素であるCytochrome P450 family2 subfamily C遺伝子が、コアラゲノム上で広く存在していたらしい。
これはユーカリが持つ毒素を無害化するため、進化の過程でゲノムの中に作られた必要なメカニズムなのでしょうね。

私が感じたこの論文のすごいところは、単にゲノム読みました!の論文では無く、これを読むとコアラの生態、生物学的特徴、感染症や免疫学までがひととおりざっくりわかってしまうこと。
普段コアラのマーチでしかコアラに縁がない私にとって、コアラが身近に感じた、そんな論文でした。