2013年6月10日月曜日

メチル化検出の限界とチャレンジ


最近良く聞かれる質問をシェアします。
PacBioによるメチル化検出のことです。

PacBioのSMRTシークエンスと言えば、昨年から、メチル化をダイレクトに読める、という触れ込みで宣伝してきました。
本社のホームページでも、メチル化(正確にはBaseModification=塩基修飾)をBisulfite無しで検出できる!というのを、Pacならではの技術だと宣伝しています。
http://www.pacificbiosciences.com/applications/base_modification/
(余談ですが、このPacBioのページ、セキュリティの関係か、見れないこともあるようです。特に大学内から見ようとするとページが見つかりませんエラーが出ることもあります。)

論文等で良く出てくるのが、バクテリアの塩基修飾の検出です。 これはもう、ほぼ確立された技術と言っても良いでしょう。
昨年の論文になるけれども例えば、
1. Fang et al. Genome-wide mapping of methylated adenine residues in pathogenic Escherichia coli using single-molecule real-time sequencing, Nature Biotechnology (2012)
2. Schadt et al. Modeling kinetic rate variation in third generation DNA sequencing data to detect putative modifications to DNA bases, Genome Res. (2012)
3. Murray et al. The Methylomes of Six Bacteria, Nucl. Acids Res. (2012)

バクテリアのメチル化で有名(?)なのに 5-メチルシトシン、4-メチルシトシン、6-メチルアデニン、があります。
 以前、ここのブログ(Base Modification 塩基修飾 (新)で、検出のされ方について書きました。
なので、IPDとかの説明は省略しますが、上の図の右側が、IPD-Ratioのシグナチャーです。
4mCと6mAは、はっきりとピークがあることがわかりますね。
ところが5mCに関しては、「えっ、どこ?」というくらいわかりにくい。

そこで、Tet1という酵素の登場です。
Tetは5mCを化学反応で5‐カルボキシシトシンに変えてしまうのです。
5caCに変換してからPacで読んでみると、このとおり(下図の右)、IPD-ratioがはっきりとしてくる!

と、まあここまでは、バクテリアの塩基修飾検出、では良いのですが、相手が真核生物となると、新たな問題(というか挑戦)が出てくる。
「5-メチルシトシンと、5‐ハイドロキシメチルシトシンは見分けつくのか?」

今のところ、できるという保証はできません。 否、できるかもしれません。 できたらそれで一本書けるでしょうね。 (と、だんだん表現を肯定的に変更)
なぜかというと、Tetでの変換はそもそも、5mCを5hmCに変換し、その後いろいろステップがあって最終的に5caCになります。
つまり、5mCは全て、5hmCに変わってしまうので、5caCになったあとで、どれが5mC由来でどれが5hmC由来だったかわからない!

 
というわけなんですが、理論的には、5hmCをグリコシル化しTet変換から守ることで、5mCだけを5hmCと区別して検出することはできそうです。
できそう、と書いたのは、やったことが無いので、本当に出来るか自信が持てないから。
PacBioで試しているかどうかはわかりません。
もしかすると、ユーザーの誰かが挑戦しているかな? 
 
高等真核生物では、メチル化と言っても、ゲノムの色々な場所に集まって存在するケースが多いですよね。 
CpGアイランドとかインプリンティング領域とか。
そういうところでは、メチル化のIPD-Ratioのピークがマージされて、別のシグナチャーになってしまいます。 
ゲノムに比較的バラバラに存在するバクテリアの時と、同じアルゴリズムでは検出できないので、そこを今、PacBioでは時間をかけて開発しています。
 
 

0 件のコメント:

コメントを投稿