しばらくブログを更新していないと、「最近忙しいんですか?」と言われ、
頻繁に更新していると、「最近ヒマなんですか?」と言われる。
いえいえ、ヒマなわけ無いじゃないですか!!
で、10月全く更新していなかったのは、わけがあるんです。
10月は、試薬の大きなバージョンアップの発表があって、本当は書きたかったんですが、ポリシーというか、顧客第一主義というわけで、まずは、全顧客に知らせてから、ということにしたんです。
ちょうど昨年の10月、NGS現場の会の大会で、新しい試薬P5-C3を発表しました。
平均リード長 8,500 bp ということになりました。
今年、新試薬P6-C4は、平均リード長が10,000 bpを越えます。(最適条件下でね)
こちらが完成した新しいカタログに載せているリード長の分布↓
どうですか?
びっくりしますよね。
分子生物学会で、ブース番号53に、カタログを置いておきます!
ところで、今日は、Iso-Seqの話。
以前も書きました、cDNAのアイソフォームを、アセンブリ無しに一気に読む方法です。
先日も某大学でセミナーをしてきたのですが、後で個別質問が出まして、改めて一緒に考えたりもしました。
そんな中、良い論文がありますので紹介します。
Pretto et al., (2014) Differential increases of specific FMR1 mRNA isoforms in premutation carriers. J Med Genet.
PubMed番号
25358671
まだahead of print ?
この話は以前、「
Iso-Seq WholeかTargetか」のところで書いた、Target Iso-Seqです
題材は、
FMR1遺伝子 以前、2013年の4月、「
リピートの秘密」のところでも書いた、CGGリピートがフェノタイプを決める、あの遺伝子です。
当時の論文は、CGGが200回連続でリピートしていても、PacBioで読めるぞ!というような、「GCに強いPac!」というメッセージが強めでした。
でも、よく考えたら、このリピートによって影響を受けるのは転写される遺伝子、mRNAです。
というわけで、このDifferential increases...の論文で注目したのは、転写されたmRNAのアイソフォームです。
|
figure from Pretto DI, et al. |
Premutationと呼ばれるキャリアーは、CGGが55~200リピート。
このリピートはFMR1遺伝子の5'UTRと、Exon1の間にあります。
17個のCoding ExonからなるFMR1は、リピートの数によって、RNA-bindingドメインであるExon12や、アルギニン-グリシン-グリシン(RGG)RNA-bindingドメインやリン酸化サイト、メチル化サイトが存在するExon15が、Alternative Splicingを起こすのです。
でも、これまでどのようなアイソフォームが何種類存在するのかはわかっていなかった。
そこで、Iso-Seq!
遺伝子の後ろのほうが、スプライスされているから見てみよう、ということで、Exon9と3’UTRを挟むようにプライマーを設計。これでExon9から17までのスプライスイベントが読める。
ControlとPremutaionのサンプルを、PBMC(perpheral blood mononuclear cells)、cerebellum brain、primary fibroblastsからそれぞれ得て(計6サンプル)、これらのcDNAを先の配列特異的プライマーで増幅。
そして6つのライブラリを作ってそれぞれPacBioシークエンス(SMRT Sequence)
平均18,000リード/サンプルが得られたらしい
精度90%以上のCCSを解析に使用と言っているので、リード長の中央値が1,053bpと書いているのも恐らくCCSの長さのことだろう。
Exon9から3'UTRまでの想定される長さが1,095bpなので、間違いなく彼らの言うリードとはCCSだ。
ゲノムにアラインして、Exon9と3’UTRにマッチしなかったリード(CCS)は除去
これで26%が消えたらしい。
さらにPBMC、Brain、Fibroblastに共通して見られるアイソフォーム、などという条件で絞り込んでいくと、16種類のアイソフォームが見えてきたという。
もちろん、というか、5’UTRからExon8までの間もちゃんと増やして見ている。
ここではExon3のスキップがあったそうだ。
PacBioのシークエンスは、いくつもの連続するExonを読みきることで、アイソフォームの形を見ることができる。
では、発現量はどうか?
彼らは、そこにはNGSは使っていない。
qRT-PCRを使用して、発現量を測っている。
この論文は、FMR1転写物のスプライシングによって、どのFMR1アイソフォームが作られているかをPacBioのシークエンスで調査した初めての研究です!
ちなみにこのシークエンスが行われたのは、前のバージョンのRSで、一度に75,000個のZMWしか読めない機械。ケミストリーはC2
1サンプルに付き、2-3個のセルを使っていたらしい。
当時は平均リード長が、2,000 bp とか3,000 bp とか言われていた時代。
あれからたった2年ですよ。
今や平均10,000bp越え。
ところで、Alternative splicingの論文は、アイソフォームの絵を見ないと、読んでいてもさっぱりイメージつきませんね。
論文には、Fig.5に、きれいなExonのスプライスされた絵があるんですが、これ無しで論文を読み進めてもチンプンカンプンでした。