2015年8月8日土曜日

DNANexus

「猛暑日」
日中の最高気温が35度を超えるとこう呼ばれますが、東京は今日8月7日で、1週間連続の猛暑日だそうです。
5年後の東京オリンピックは8月6日から。こんな暑い中、屋外競技は厳しいだろうなあ。
何かと話題の新国立競技場も、東京ドームみたいに、完全エアコン&屋根付きにすれば良いけど。
そうなったら建設費はいくらになるのかな?
ちなみに東京ドームができたのは1988年。バブルの真っ只中、建設費は350億円だったそうな(ここにまとめあり

さて、私がいまバイオインフォ関連で気になっているのは、前回も紹介したDNANexusという会社。
ここはGoogle Ventureも出資しているアメリカの会社で、クラウドでの解析パイプラインがメインです。
この会社は、FalconによるPacBioデータのアセンブリパイプラインを提供しています。
先月のPacBioユーザーグループミーティングでも発表していました。
Falcon、ってインストールがとても複雑なんです。
環境依存が多くて、なかなか素人には手が出ない。
そもそもヒトゲノムレベルのゲノムサイズをFalconアセンブリするには、それなりのクラスターサーバーが必要。
でもDNANexusは、アマゾンクラウドを使っているので、理論的には世界最大級のスパコンを使うことができる、というわけ。

Falconアセンブリは、HGAPのようにエラー補正ステップが最初にあります。
このステップが一番計算量を消費する。

DNANexus社のスライドより
上記には、HGAPの最後のステップであるQuiverは含まれていません。
Quiverもそこそこ時間がかかります。

ユーザは、アセンブルに必要なPacBioの生データ(bax.h5とmetadata.xml)を、DNANexus社のツールでアップロードします。
あとは、こんなパイプラインをポチっと。

出力データは

  • エラー補正後の生リード(Pre-Assemblyリード)
  • Primary AssemblyのFASTAファイル
  • Alternative Contig(バブル)
  • 各ステージでの中間ファイル 
結果がまずければ、例えばステージ2から再開できるように、中間ファイルを保存しているそうです。

その後、Quiverをかける。
Quiverというのは、HGAPでも使っていますが、エラー補正をする前の生サブリードを、アセンブリ後のContig配列にマップして、生サブリードの持っているクオリティデータを使いながら、Contig配列を補正していくプログラムです。

さて、ここまではアセンブリの話。
もちろん、構造変異解析のパイプラインもあります。

皆さん、Parliamentというのをご存知でしょうか?

Parliamentとは、構造変異解析のツールで、BreakdancerやPBHoneyなどに広く使われているそうです。

Illuminaデータ、PacBioデータ、Irys、Nexteraなど様々なデータに対応します。
例えばイルミナデータとPacBioデータがある場合、数ある変異検出ツール(DellyやCNVator)で変異があっただろうとされる場所をまとめて、そこのみをローカルアセンブリして構造変異の場所を出力する。
「数ある変異検出ツール」というのを、DNANexus解析パイプラインでは、Parliamentひとつでまとめてしまって、簡潔なものにしています。
DNANexusのスライドより

今のところ、イルミナ用の構造検出ツールは数が多く、PacBio用にはPBHoneyのみしか無い。
なので、Parliamentを最大限生かすには、イルミナデータがあったほうが良いとのことです。
しかし今後は、PacBio用の構造変異検出ツールも増えてくるだろうから、期待したいですね。

---------------------ここまではDNANexusの話------------------------

さて、せっかく構造変異の話をしたので、ついでに宣伝です。

前にもお知らせしましたが、SNVとかIndelとかを見つけた後に、それがどのくらい意味があるものなのか、を調べるのは大変だけれども重要なこと。
データベースに照らし合わせてフィルタリングするのが普通でしょうが、このIngenuity Variant Analysisが追加で持っているデータベースはちょっと違う。
何百人ものPhDホルダーが、10年以上かけて文献から抽出した、パスウェイ・ネットワーク情報です。
これ自体でも価値のあるデータベースでしょうね。

このIngenuity Variant Analysisは、「変異情報から病態・疾患情報や機能・パスウェイとの関連性について、【短時間で、簡単に、信頼性の高い解析結果】を出力するツールです。



キャンペーンお申込みwebページはこちら

Ingenuity Variant Analysisについて詳しくはこちら
応募してみたいが、できるかどうかわからない方、IVAの概要説明をご希望の方は、下記までお問い合わせください!
トミーデジタルバイオロジー(株)
info_ap(AT)digital-biology.co.jp  (AT)の部分を@にして下さいね。












0 件のコメント:

コメントを投稿