2016年10月19日水曜日

アメリカ人類遺伝学会 ASHG GIBとリファレンスゲノムの話

ASHGに来ています。今日は初日。
午後1時からの Genome In a Bottle とリファレンスゲノムのセミナーを聞きました。
Genome In a Bottle(GIB)といえば、前にも書いた気がしますが、ヒトゲノムのリファレンスマテリアル(リファレンスゲノムとは違う)をいくつか決めて、そのゲノムを様々な技術で読んで、変異解析をする、そのスタンダードを決めようというプロジェクト。
今はNA12878、Ashkenazim Trio、Asian などが、リファレンスマテリアル(RM)として解析されています。

RMは誰でも買うことができます。
新しい解析パイプラインを開発するひとは、RMを基準(スタンダード)に開発すれば、世界的な信頼性が得られるということ。
これから出てくるであろう新しい技術もそうですね。こういうスタンダードは必要です。

GIBでは様々な技術を試して、そのデータを公開しています。
Justin Zook氏のプレゼンより

この中でも特に、PacBioのデータは、ここ数年でデノボアセンブリの「スタンダード」になりました。
で、PacBioと親和性の高い新参者テクノロジーとして、Dovetailがあります。
同じくZook氏のプレゼンより
AJ Son のアセンブリでいうと、PacBioとDovetailで、Scaffold N50 が 12.9 Mb - 20.6 Mb になっている。
もちろんこれらはドラフトアセンブリなので、クオリティはどうかわかりません。
でも、後でJustinさんと話したのですが、10XもDovetailも、理論的にはPacBioアセンブリを補正(つなぐという意味で)するのにとても向いています。
ただ、10XとDovetail、あとBioNano を、まだ比較はしていないそうです。

Justinさんは、昨年来日して、沖縄と東京で講演しました。
「そのときに比べて、ずいぶん新しい結果が出てきましたねえ」と言ったら、「もう新しい技術が出すぎて大変だよ。やることたくさんある」と笑顔で返されました。

さて、彼のプレゼンは、Slide ShareにUPされていますので、参照したいかたはどうぞ。
ほかの演者のプレゼンもアップされるそうです。

アセンブリの話で、FalconのようにDiploid のアセンブリができるようになったけれど、それを表現するファイルフォーマットが必要、というのがありました。確かに!
Fastaではうまく表現できないですよね。
あとViewerも。誰が世界標準を作るのか?

GRCh38 のゲノムには、Alternative Loci配列がたくさんあるのは知られていますが、これが結構頻繁にバージョンアップされているのは、事実です。
じゃあ、今のバージョンでマッピング→変異解析 してデータ集めているひとは、バージョンが変わったら、やり直す方が良いんですかね?
主にショートリードでヒトゲノムをがんがん読んでいるひとには、結構クリティカルな問題だと思いますが、皆さんどうしているんでしょう?

なんか、パーソナルゲノムがどんどん読まれている時代だと、GRCh38にマップして解析するより、人種が近いゲノムを使って解析し直したほうが良い気がします。
そんなふうに思いながら、セッションを聞いていました。

セッション自体はそんなに大きな部屋ではなかったですが、第一線でリファレンスゲノム作っている研究者が集まっている感じでしたね。PacBio、BioNano、10Xのひとももちろんいましたし。
だんだん知り合いが増えてきた感じ。

Diploid のアセンブリ、Falconといえば、先日改良版の Falcon-Unzipが Nature Method の論文になりましたので、こちらも参照くださいね。


0 件のコメント:

コメントを投稿