2013年10月23日水曜日

Human 10x データ公開

お待たせしました!
って、待ってないかな? Humanを10xで読んだときのデータが公開されました。

Evan Eichler 博士(Howard Hughes Medical Institute, University of Washington)との共同で、このたびPacBioでは、CHM1TERTセルラインを読みました。
詳しくはPacBioのブログにのっています。

以下は、DevNet(PacBioの別サイト)から
Sequencing Data Statistics
Total number of reads: 3,679,463
Total number of post-filtered bases: 32,559,803,198

Read length statistics      
Half of sequenced bases in reads greater than: 10,985 bp
5% of reads longer than: 19,060 bp

SMRTbell template statistics
Longest DNA insert sequenced: 41,460 bp
5% of sequenced DNA inserts longer than: 18,060 bp
Average sequenced DNA insert length: 7,406 bp

PacBio RS II instrument time for sequencing: 10 days
Number of SMRT Cells: 66
20kbライブラリを、Blue Pippinでサイズセレクションして、最新試薬P5C3で読んでいます。
ちなみにまだ、この試薬はアメリカの限られたサイトでのみ使用可です。
日本ではもう少しかかりますね。

PacBioのブログに行けば、サブリードのグラフも見てとれますが、結構すごい。
15kbとか25kbとか、読めてます。

10日間、66セルを使って、ヒトゲノムの10xデータ

彼らはhg19(GRCh37)にマッピングして、Deletionなどを見つけています。
ところで今、BostonのASHGに来ているのですが、ちょうどさっきGRCh38はこうなる!みたいな話を聞きました。
37よりもCentromere や、Gapのデータが更新されているそうです。
1000人ゲノムデータやOptical Mappingのデータも使ってかなりの更新になるそうです。
くわしくは彼らのブログをチェック!

このPacのデータも、GRCh38にマップしてみたい!

ところで、先ほどの10xのPacデータ、Pacブログのところに書いてある通り、ダウンロードできます。
メールを送ると自動でURLが帰ってきますので、興味ある方はどうぞ。
マッピングデータ(BAM)だけでも価値はあるかも。

0 件のコメント:

コメントを投稿