これは以前もこのブログで紹介しました
ところで、良くある質問が、どれくらい読んだら十分か、というもの。
転写量が低いアイソフォームも高いものも、まんべんなく検出するには、何セル読んだら良いのか?
簡単なようで難しい問題です。
これは逆に出力から考えた方が良さそうです。
1つのSMRT Cellから出力されるリード数は、およそ6万本。
1本1本が独立のアイソフォーム配列由来です。
ReadsOf Insert、別名CCSですが、これがちゃんと全長cDNAをカバーしているかどうかが大事です。
ここで全長というのは、逆転写酵素で転写産物を復元した後、PCR増幅するときのPCRプライマー配列が、シークエンスされた後のReadsOf Insertで、5’側と3’側にちゃんとあることを言います。
つまり、長いアイソフォームほど、全長読まれる確率は低くなる
設定するReads Of Insetのパス数は、アイソフォーム配列の精度に影響する
では、出力されるReadsOfInsertのうち、どれくらいが全長読まれたものなのか?
先月のユーザーミーティングでは、いつくかIso-Seqの発表もありました。
その中のひとつでは、3パターンでサイズセレクションをしていて、そのうち完全長cDNAだった割合は、
- 1-2kb:50%(1セル6万本出力と仮定すると、3万本)
- 2-3kb:30%(同18,000本)
- 3kb-:20%(同12,000本)
というふうに、転写産物の長さが長くなるほど、完全長アイソフォームの数は少なくなりました。
当然といえば当然。
他の発表でも、サイズセレクションのデータは無いけれど、8セル使ったIso-Seqの実験で完全長は21万本。
64セル読んだときは完全長cDNAは100万本(全体のリード数は470万本)だったそうです。
このような数字が、自分の目的に合うかどうか?
で、計算してはいかがでしょうか。
しかし、完全長cDNAといっても、もしかすると5’側の配列が欠けていることがあるかもしれません。
これは逆転写酵素Takara-Clontech SMARTerが、最初に転写産物の5’キャッピングをしないことが原因です。
5’側まで行かなくてもcDNAが完成してしまうため、ある程度、完全長では無いcDNAができてしまいます。
その後PCR増幅するときに使う5’と3’のプライマー配列が、シークエンスで読めていれば、Iso-Seqでは完全長cDNAと言います。
ここ、気をつけて下さい。
もうひとつ、その昔、Iso-Seqが開発途中だった3年前の話です。
転写ノーマライゼーションというものがありました。
これは、転写量が高いアイソフォームばかり読めてしまって、転写が低い産物がなかなか読めないことを防ぐために考えられたプロトコルです。
カムチャッカカニから抽出したDuplex-specific nuclease(DSN)を使用した方法で、原理としては以下のようなもの。
- 一度cDNAをDenatureしたあと、Renatureする→ Abundantな転写産物ほど二本鎖に戻りやすいはず
- 二本鎖DNAを特異的にHydrolyzeする酵素(DSN)で処理する→ Abundantな転写産物ほど優先的に分解される
- 転写レベルが低かったcDNAが分解されずに残る
→ これでライブラリを作ることで、レアなcDNAも少ないセル数でシークエンスすることができるし、高発現だったcDNAは、2のところで分解されてライブラリにならないはず
しかーし、結局公式プロトコールにはならなかった。理由は以下の通り
- cDNAを一旦Denatureした後、二本鎖にする段階で、長いcDNAほど、同じ配列(ドメイン配列など)を有する他のアイソフォームと非特異的に二本鎖を形成する確率が高くなる
- 長いcDNAは、それが例えレアな転写産物であっても、非特異的Renatureを作りやすいことで、結果DSN分解(hydrolysis)されてしまう
- ノーマライゼーションステップには、追加でPCR増幅が必要なため、さらに増幅バイアスが生じる(Iso-Seqは2回、PCR増幅しますので、ノーマライズするときは合計3回のPCRが必要になる)
これらを考えて、海外のあるユーザは、2kb未満の比較的短いcDNAに対してのみ、ノーマライズ処理をしているそうです。
短ければ非特異的Renatureはある程度防げるだろう、という考えです(増幅バイアスはかかりますが)。
とは言うものの、PacBioとして公式に勧めているプロトコルではありません。自己責任です。
酵素自体はEvrogen社で販売されているようですね。
じゃあ今はどうなんだ? と聞かれそうですが、今もノーマライゼーションは公式プロトコルにはありません。
転写産物の高いものだけを、読む前に減らす方法は難しいのかな。