2018年5月29日火曜日

ヒト構造解析とFix-C

前回Hi-Cについて少し触れたので、もうちょっと。
Hi-Cと言えばこれらの論文が有名です。


結構前からあるテクノロジーなんですね。
元々は染色体の構造、3次元での構造を解析する技術です。

それをゲノムアセンブリに応用したのが、Chicagoであり、Dovetail Hi-Cであったわけですが、もともとの構造解析という使い方を応用して、「ヒトゲノム構造解析」というのも可能なわけです。

Dovetailのヒトゲノム構造解析サービスは、アメリカではすでに行われています。

この資料はここからダウンロードできます。

実験の原理は、ゲノムアセンブリに使うHi-Cと同じです。
最初のサンプルが血液、細胞、またはFFPEサンプルになります。

ちなみに血液なら2mL 、細胞の場合10の7乗個程度、FFPEは厚さ10μmのスライス、組織の場合は1平方㎝ x 20μmが必要量らしいです。
そこからHi-Cライブラリを作製し、HiSeqを使って2x150PEで150M本読む。

そしてヒトゲノム参照配列にマッピングし、距離の分布図を作る。
染色体レベルの転座や大きな欠損変異などを検出する。
→解析のソフトウェアは、Selvaというものを用いる。

検出できる変異の大きさは、50kb以上です。それ以下だと感度が下がるそうです。
つまり、PacBioとは競合しない!!
PacBioは50bp~50kbくらいまでのInDel検出が得意だけれども、50kb以上の巨大な変異はリードが届かないので検出できない。
Hi-Cは連続配列では無くリードペアで変異を検出するので、あまり小さい変異検出だとノイズと差がはっきりしない。そのかわり、染色体レベルの構造変異検出には強い!

論文もbioRxivですが投稿されていますので、アルゴリズムに興味のあるひとはどうぞ。
検出感度でいうと、FISHと比べてもひけをとらず、例えば12個のがんのFFPEサンプル(20~90%の割合)をHi-C+Selvaで解析し、FISHで検出できた変異とどれくらい合っていたか、を比較したデータがあります。
Dovetailヒト構造解析のProduct Highlightから
ダウンロードできる資料です
ほとんどはFISHの結果と正しく、またサンプル#1や#6は、FISHの方が間違っていたそうです。がん細胞の割合が20%のとき、50kb以上の大きさの構造変異の検出感度は67%です。100%がん細胞のときは検出感度90%だそうです。

そしてこのFFPEからのHi-C、というサービスを行っている会社はほかに無いらしく、Fix-Cという商標をつけています。
FFPEはもともとDNAがフラグメント化しているから、ロングリードには向かないんですよね。

最後に、これは「まだ」受託サービスのみ、の商品なんです。
つまりサンプルをアメリカに送らなければいけない。
アメリカ国内のサンプルなら国内移動で問題無いので結構売れているらしいです

キットやソフトウェアの配布は、今のところ、予定はありません。
そういうニーズが世界的に増えて、キット&ソフトウェアの配布が可能になればもっと世界に広がる技術だと思うのですが。
とりあえず、海外へ送ってもいいサンプルで、この変異解析に興味がある方は連絡ください。
1サンプル、凄く高めに見積もっても50万円くらいです。
実際は都度見積もりですけれど。

2018年5月27日日曜日

PacBio 解析ウェブセミナーと、Hi-C解析のソフト

先日は秋葉原にて、第4回目となる「PacBio現場の会」を行いました。
事前登録88名、プラス演者の先生方、協賛企業の方々、我々。
部屋のキャパの都合で88名で打ち切ったのですが、もっと大きな部屋を用意すれば良かったかなあ。
情報交換会やその後の有志二次会も楽しかった。

個人的な意見ですが、NGS現場の会の大会が無くなって、NGS関連の情報を総合的に、学術的な枠を超えて、得る場がほぼ無くなったと思います。
植物の研究者、魚類の研究者、微生物の研究者、がんの研究者、遺伝病の研究者、、、。
こういう方々が一同に会す場はなかなか無いですよね。
共通点はゲノム、ということでシークエンサー関連の企業のセミナーが集まりやすいのでしょうね。たいてい無料ですし。

余談ですが、大きな国際学会、例えばアメリカ人類遺伝学会とかでは、企業はブースやセミナーの他に、レストランを貸し切って招待制のディナーや、パーティー(Customer Appreciation Event )をするんです。
お客さんとのネットワーキングが主目的で、あとは主催企業のプレゼンなどがあります。
こういうの、日本でもできないかなあ。

さてさて、PacBioデータ解析のウェブセミナーが日本にやさしい時間帯で行われます!
深夜じゃないよ!

第一回: 6/7 1PM~ デノボアセンブリ解析のウェブセミナーです
 A Sketch of Assembly Recipes for PacBio Data

第二回: 6/14 1PM~ トランスクリプトーム解析のウェブセミナーです

初心者にもわかりやすい内容、と聞いていますので、これから始めるひとにも良いかと思います。

さてさて、今日お知らせしたいのはもうひとつ。
PacBioのデータのアセンブリと言えばFalcon+Unzipですよねー?
Hi-Cデータというのは、Dovetail Genomicsでも行っているあの、染色体レベルでスキャフォルディングをするデータです。
最近ではここのPAG報告で紹介しました。
Hi-Cについては遺伝研の東先生のこのスライドがとても良くまとまっていると思います。

このHi-Cデータを使ってPacBioのアセンブリ結果からスキャフォルディングするアルゴリズムの論文が出ました!

FALCON-Phase: Integrating PacBio and Hi-C data for phased diploid genomes

PacBioデータとHi-Cデータが手元にあって、アセンブリに興味のあるひとは使ってみたらいかがでしょうか?

2018年5月4日金曜日

Sequel を爆買いする中国の勢いが止まらない(ジョークです)

注:ジョークです エイプリルフールネタにしようと思っていた
------------------------------------------------------------------------

中国では、Novogene社やAnnoroad社がSequelを10台単位で購入しているそうで、その爆買いぶりに開いた口が塞がらない。
そんな中、PacBio本社では、これからさらに来るであろう注文を見越して生産態勢を一層強化したそうです。
それがこの写真!
生産が完了したSequelたち
日本含むアジアに向けてまもなく出荷予定のSequelたち
積み出しを待つSequelたち
こちらは欧米向け出荷予定のSequelたち
これちょっと並び方がおかしい? それは真上から撮影したらわかります。

すみません、全体を写すとこうなります
遊び心がありますねー。
NGSの装置で会社のロゴを作ってしまうとは!!



ゴールデンウィーク中日ですからこういう軽いネタで許してください
はい、もちろんこれは本物の装置ではありません。USBです。
欲しいかたは↓こちらの会に参加してGET! 数に限りがあるので早いもの勝ち

5月18日「PacBio現場の会 2018」
まだ若干席がありますよ!