2013年3月22日金曜日

Pacでヒトゲノム

近い将来、ヒトゲノムを診断に使う日が来るでしょう。 実際私も、23andMeで自分のSNP解析をしてみたことがありますが、お金とチャンスがあれば是非Whole Genomeを読んでみたいものです。
23andMeのサービスはとても手軽なんですが、参考にしているデータベースが白人なんですよねえ。
え、結果ですか?
いたって健康。 特に遺伝的な異常無し。 でした。
ワーファリンによる副作用が平均より1.6倍高いかも?くらいなことが唯一気をつけるべき項目でした。

そんな来るべきゲノム診断に向けて、シークエンスメーカーはビジネスチャンスを狙っているわけです。
前回、Pac CEOのインタビューの中、クリニカルな応用を考えているユーザもいる、と書きました。
今日はそのユーザの話です。


2009年から2012年7月までPacBioのChief Scientific Officer を務め、また2011年8月からMount Sinai School of Medicineのチェアーを務めるEric Schadt氏。
彼はPacBioをクリニカルに応用できないかと追求するひとりです。
AGBTで講演内容です。
ビデオのリンクはここ
講演の後半からPacBioについての話が始まります。



彼らは、ヒトゲノム(NA12878)を、Illumia HiSeq、Roche454、PacBio RSを使ってそれぞれ30x、15x、10x+のリードを得ました。
10xのカバレッジを得るのに使用したPacBioリードは1200万本。 単純計算で360 ~ 400 SMRT Cell 使った計算になります。あるいはそれ以上?
平均リード長は4,066 bp、平均サブリード長は2,766 bp、95thパーセンタイルは11,630 bpだったそうです。
「クリニカルな応用に関しては、Pacのロングリードはリピート配列に対してアドバンテージがあります。」 
20くらいの遺伝子に存在するリピート配列が、重要な疾患マーカーとして既知だそうですが、それらはショートリードで読むことは不可能です。 

しかし彼らのPacBio10xデータによると、例えば4番染色体のHuntingtin 遺伝子ではCAGリピートとCGGリピートを同じシングルリードが12本もカバーし、また精神疾患に深く関与することが知られている19番染色体のカルシウムチャネルα1サブユニット遺伝子CACNA1Aでは、1キロほど離れた2つのリピート(CAG)nと(ACC)nを10本~15本のシングルリードがカバーしていました。


このほかに、3塩基リピートについて言えば、少なくとも50リピート以上(つまり150bp以上のリピート)の、約10,000箇所のリピートのうち84%を、今回の10xのデータでカバーできました。
これは他のテクノロジーでは真似出来ないことです!

と、ここまできて、冷静に考えると、「全ゲノムを10xで読めばいくらかかる?」
という疑問が湧いてくるでしょう。
疾患の診断に、ヒト全ゲノムを何百Cellも使って読むのは(今はまだ)“コスパ”悪すぎですね。
現実的には、重要遺伝子またはゲノムの場所だけにターゲットを絞って一分子で読む、ことになるでしょう。
この講演は、PacBioのロングリードを使えば今まで見えてこなかったヒトゲノムの構造が(一部)わかってくる、というものです。


Schadt氏らは現在、Illumina/PacBioのハイブリッドExomeテストを試みています。 これはPacBioでしか読めないような、5Mbpの箇所のキャプチャーシークエンスを、今までのショートリードExomeに組み合わせるような手法です。
個人的にはキャプチャーしてくるところが特に興味があります。
いろいろ(ハイブリや酵素処理など)手法はあるようですが、ロングリード用にExomeキャプチャープロトコルが早く確立されれば良いですね。
願わくばExome以外の特定ゲノムのキャプチャーも。


0 件のコメント:

コメントを投稿