って、待ってないかな? Humanを10xで読んだときのデータが公開されました。
Evan Eichler 博士(Howard Hughes Medical Institute, University of Washington)との共同で、このたびPacBioでは、CHM1TERTセルラインを読みました。
詳しくはPacBioのブログにのっています。
以下は、DevNet(PacBioの別サイト)から
Sequencing Data Statistics
Total number of reads: 3,679,463
Total number of post-filtered bases: 32,559,803,198
Read length statistics
Half of sequenced bases in reads greater than: 10,985 bp
5% of reads longer than: 19,060 bp
SMRTbell template statistics
Longest DNA insert sequenced: 41,460 bp
5% of sequenced DNA inserts longer than: 18,060 bp
Average sequenced DNA insert length: 7,406 bp
PacBio RS II instrument time for sequencing: 10 days
Number of SMRT Cells: 66
20kbライブラリを、Blue Pippinでサイズセレクションして、最新試薬P5C3で読んでいます。ちなみにまだ、この試薬はアメリカの限られたサイトでのみ使用可です。
日本ではもう少しかかりますね。
PacBioのブログに行けば、サブリードのグラフも見てとれますが、結構すごい。
15kbとか25kbとか、読めてます。
10日間、66セルを使って、ヒトゲノムの10xデータ
彼らはhg19(GRCh37)にマッピングして、Deletionなどを見つけています。
ところで今、BostonのASHGに来ているのですが、ちょうどさっきGRCh38はこうなる!みたいな話を聞きました。
37よりもCentromere や、Gapのデータが更新されているそうです。
1000人ゲノムデータやOptical Mappingのデータも使ってかなりの更新になるそうです。
くわしくは彼らのブログをチェック!
このPacのデータも、GRCh38にマップしてみたい!
ところで、先ほどの10xのPacデータ、Pacブログのところに書いてある通り、ダウンロードできます。
メールを送ると自動でURLが帰ってきますので、興味ある方はどうぞ。
マッピングデータ(BAM)だけでも価値はあるかも。