2017年5月25日木曜日

結核菌のリファレンスの間違いをPacBioで補正

NGS現場の会も無事終わり、ほっと落ち着いたのもつかの間の通常業務でした。
アカデミアの方へ質問!
企業のひとはこういう学会・展示会の後、何をしていると思いますか?

答え:もらった名刺の整理と頂いた質問への対応、営業ならお願いされた見積もりの作成や次のアポの準備、そして、展示会場から届いた配り残ったチラシや装飾品の片づけ。
でもこれも慣れました。

と愚痴はこれくらいにして、私がしゃべった2つのスポンサードセッション、PacBioとDovetailのスライドが欲しい方、会場でご依頼された方以外で欲しい方がいらっしゃればお知らせください。リンク送ります。

さて、本当はスライドに入れたかったけれど準備不足で抜いてしまったネタがあります。
それはこちらの論文
結核菌のゲノムアセンブリです。
そういうと、今まで何回も紹介してきたとお思いでしょうが少し違います。
なんと、今までのリファレンスが間違っていたということを示した例だからです!
毒性の高いH37Rv株とそうでないH37Ra株。H37Ra株の方は2008年にアセンブリされて以来更新されておらず、またこの株は毒性遺伝子同定のための、リファレンスに使われていたとのこと。
PacBioで読んだところ、その株特有の変異は、これまでのリファレンス配列で示されていた変異とされていた箇所の、実は半分ほどだったという驚きの結果!

結核菌はGCリッチです。ゲノムの80%ほどがGとCでできています
ゲノムの平均GC含量は60%超、ゲノムの場所によっては80%に達するところにもあるそうです。
PCRが必ず入るサンガー法ではどうしても読めないところがあるのだと思います。

PacBioのSMRTシークエンスは、ご存知の通り、GもCもまんべんなく読めることが特徴で、その時のエラーもランダムに入る。
リファレンスのエラーをも直してしまうなんて驚きですね。



3 件のコメント:

  1. 結核菌のGCは60%です。

    返信削除
    返信
    1. ご指摘ありがとうございます。
      修正しておきました。

      削除
  2. このコメントは投稿者によって削除されました。

    返信削除