日中の最高気温が35度を超えるとこう呼ばれますが、東京は今日8月7日で、1週間連続の猛暑日だそうです。
5年後の東京オリンピックは8月6日から。こんな暑い中、屋外競技は厳しいだろうなあ。
何かと話題の新国立競技場も、東京ドームみたいに、完全エアコン&屋根付きにすれば良いけど。
そうなったら建設費はいくらになるのかな?
ちなみに東京ドームができたのは1988年。バブルの真っ只中、建設費は350億円だったそうな(ここにまとめあり)
そうなったら建設費はいくらになるのかな?
ちなみに東京ドームができたのは1988年。バブルの真っ只中、建設費は350億円だったそうな(ここにまとめあり)
さて、私がいまバイオインフォ関連で気になっているのは、前回も紹介したDNANexusという会社。
ここはGoogle Ventureも出資しているアメリカの会社で、クラウドでの解析パイプラインがメインです。
この会社は、FalconによるPacBioデータのアセンブリパイプラインを提供しています。
先月のPacBioユーザーグループミーティングでも発表していました。
Falcon、ってインストールがとても複雑なんです。
環境依存が多くて、なかなか素人には手が出ない。
そもそもヒトゲノムレベルのゲノムサイズをFalconアセンブリするには、それなりのクラスターサーバーが必要。
でもDNANexusは、アマゾンクラウドを使っているので、理論的には世界最大級のスパコンを使うことができる、というわけ。
Falconアセンブリは、HGAPのようにエラー補正ステップが最初にあります。
このステップが一番計算量を消費する。
上記には、HGAPの最後のステップであるQuiverは含まれていません。
Quiverもそこそこ時間がかかります。
ユーザは、アセンブルに必要なPacBioの生データ(bax.h5とmetadata.xml)を、DNANexus社のツールでアップロードします。
あとは、こんなパイプラインをポチっと。
出力データは
その後、Quiverをかける。
Quiverというのは、HGAPでも使っていますが、エラー補正をする前の生サブリードを、アセンブリ後のContig配列にマップして、生サブリードの持っているクオリティデータを使いながら、Contig配列を補正していくプログラムです。
さて、ここまではアセンブリの話。
もちろん、構造変異解析のパイプラインもあります。
皆さん、Parliamentというのをご存知でしょうか?
Parliamentとは、構造変異解析のツールで、BreakdancerやPBHoneyなどに広く使われているそうです。
Illuminaデータ、PacBioデータ、Irys、Nexteraなど様々なデータに対応します。
例えばイルミナデータとPacBioデータがある場合、数ある変異検出ツール(DellyやCNVator)で変異があっただろうとされる場所をまとめて、そこのみをローカルアセンブリして構造変異の場所を出力する。
「数ある変異検出ツール」というのを、DNANexus解析パイプラインでは、Parliamentひとつでまとめてしまって、簡潔なものにしています。
今のところ、イルミナ用の構造検出ツールは数が多く、PacBio用にはPBHoneyのみしか無い。
なので、Parliamentを最大限生かすには、イルミナデータがあったほうが良いとのことです。
しかし今後は、PacBio用の構造変異検出ツールも増えてくるだろうから、期待したいですね。
---------------------ここまではDNANexusの話------------------------
さて、せっかく構造変異の話をしたので、ついでに宣伝です。
前にもお知らせしましたが、SNVとかIndelとかを見つけた後に、それがどのくらい意味があるものなのか、を調べるのは大変だけれども重要なこと。
データベースに照らし合わせてフィルタリングするのが普通でしょうが、このIngenuity Variant Analysisが追加で持っているデータベースはちょっと違う。
何百人ものPhDホルダーが、10年以上かけて文献から抽出した、パスウェイ・ネットワーク情報です。
これ自体でも価値のあるデータベースでしょうね。
キャンペーンお申込みwebページはこちら
Ingenuity Variant Analysisについて詳しくはこちら
先月のPacBioユーザーグループミーティングでも発表していました。
Falcon、ってインストールがとても複雑なんです。
環境依存が多くて、なかなか素人には手が出ない。
そもそもヒトゲノムレベルのゲノムサイズをFalconアセンブリするには、それなりのクラスターサーバーが必要。
でもDNANexusは、アマゾンクラウドを使っているので、理論的には世界最大級のスパコンを使うことができる、というわけ。
Falconアセンブリは、HGAPのようにエラー補正ステップが最初にあります。
このステップが一番計算量を消費する。
DNANexus社のスライドより |
Quiverもそこそこ時間がかかります。
ユーザは、アセンブルに必要なPacBioの生データ(bax.h5とmetadata.xml)を、DNANexus社のツールでアップロードします。
あとは、こんなパイプラインをポチっと。
出力データは
- エラー補正後の生リード(Pre-Assemblyリード)
- Primary AssemblyのFASTAファイル
- Alternative Contig(バブル)
- 各ステージでの中間ファイル
その後、Quiverをかける。
Quiverというのは、HGAPでも使っていますが、エラー補正をする前の生サブリードを、アセンブリ後のContig配列にマップして、生サブリードの持っているクオリティデータを使いながら、Contig配列を補正していくプログラムです。
さて、ここまではアセンブリの話。
もちろん、構造変異解析のパイプラインもあります。
皆さん、Parliamentというのをご存知でしょうか?
Parliamentとは、構造変異解析のツールで、BreakdancerやPBHoneyなどに広く使われているそうです。
Illuminaデータ、PacBioデータ、Irys、Nexteraなど様々なデータに対応します。
例えばイルミナデータとPacBioデータがある場合、数ある変異検出ツール(DellyやCNVator)で変異があっただろうとされる場所をまとめて、そこのみをローカルアセンブリして構造変異の場所を出力する。
「数ある変異検出ツール」というのを、DNANexus解析パイプラインでは、Parliamentひとつでまとめてしまって、簡潔なものにしています。
DNANexusのスライドより |
今のところ、イルミナ用の構造検出ツールは数が多く、PacBio用にはPBHoneyのみしか無い。
なので、Parliamentを最大限生かすには、イルミナデータがあったほうが良いとのことです。
しかし今後は、PacBio用の構造変異検出ツールも増えてくるだろうから、期待したいですね。
---------------------ここまではDNANexusの話------------------------
さて、せっかく構造変異の話をしたので、ついでに宣伝です。
前にもお知らせしましたが、SNVとかIndelとかを見つけた後に、それがどのくらい意味があるものなのか、を調べるのは大変だけれども重要なこと。
データベースに照らし合わせてフィルタリングするのが普通でしょうが、このIngenuity Variant Analysisが追加で持っているデータベースはちょっと違う。
何百人ものPhDホルダーが、10年以上かけて文献から抽出した、パスウェイ・ネットワーク情報です。
これ自体でも価値のあるデータベースでしょうね。
このIngenuity Variant Analysisは、「変異情報から病態・疾患情報や機能・パスウェイとの関連性について、【短時間で、簡単に、信頼性の高い解析結果】を出力するツールです。
キャンペーンお申込みwebページはこちら
Ingenuity Variant Analysisについて詳しくはこちら
応募してみたいが、できるかどうかわからない方、IVAの概要説明をご希望の方は、下記までお問い合わせください!
トミーデジタルバイオロジー(株)
info_ap(AT)digital-biology.co.jp (AT)の部分を@にして下さいね。
0 件のコメント:
コメントを投稿