2015年9月23日水曜日

Flatwormは再生医療に役立つか?

この仕事をしていると、いろんな生物を研究しているひとと出会うんですね。
初めて知る生物の名前や、今まで誤解していた生物など、結構あるものです。
例えば、ナメクジウオ
名前から、魚なのかと思っていましたが、とんでもない。
頭索動物、という仲間で、脊索はあるけれど脊椎は無い。
つまり脊椎動物と無脊椎動物の分岐点に位置する動物というわけで、進化の研究に重要な生物だそうです。

ほかにもたくさんありますが、それはまた今度の機会に。
今日は、Flatworm(扁形動物)という生物の話です。
プラナリア、ヒラムシ、サナダムシの仲間というだけで、気持ち悪ぅー、と思ったあなた。
あなたはこの生物がどんなにすごいかを知れば、絶対考えを変えるでしょう。

切っても体が再生するんですよ!
ザリガニは足が再生しますがそんなものではない!


http://www.macgenome.org/animal.html より
今日紹介する論文はこちら

Wasik et al., (2015) Genome and transcriptome of the regenerationcompetent flatworm, Macrostomum lignano. PNAS

M. linganoという生物、こいつは切っても完全に再生するそうです。
細胞の自己再生、組織の再生の研究にはもってこいというわけ。
そこで、Cold Spring Harbor Laboratory のMicheal Schatz博士らのグループは、この生物のゲノムとトランスクリプトームを読んで、組織再生の謎に迫りました。

PacBioが活躍したのは、ゲノムアセンブリ。
M. linganoのゲノムはK-mer (23-mer) 解析から700Mbと想定。
全ゲノムの70%がリピートでトランスポゾン配列が多く、2n=8本の染色体はChromosomal Duplicationもあるとされ、当然ながらショートリードではまったくつながらない。

そこで、PacBioロングリードの登場!
ゲノム配列を10ug用意して10kbをターゲットにg-Tubeで切断、その後SMRT bellライブラリを作製し、6kb~15kbでサイズセレクションしたあと、P4C2またはP5C3でシークエンス。
試薬のバージョンからして、実験は昨年されたのでしょうね。

130x分のシークエンスデータを得た後、エラー補正を施し、実際アセンブルに用いたのは10kb以上の補正後リード21x分。
そうして、N50=64kbのContigを得た。64kbというのはこれまでの222bp(ショートリードでのアセンブリ)に比べると、大きな進歩。

次に彼らが行なったのは遺伝子アノテーションと、発現解析。
発現解析はIlluminaで行なっていますが、まあ、これはこれとして、リファレンスContigができたおかげですから。

山中ファクターとしても有名な、Oct4/Pou5f1、Nanog、Klf4、c-Myc、Sox2遺伝子は、組織再生の重要ファクターです。
この生物では、Sox2以外の遺伝子発現は見られなかったものの、哺乳類の幹細胞メインテナンスに必要な、Jak-Stat、Wnt、MAPKパスウェイは保存されていたそうです。

そのほかにも、組織が再生される過程を示すパスウェイや特定の遺伝子発現などが、哺乳類のそれと、似ているところ、似ていないところ、が示されました。
まだわからないことは多いけれど、なるほど、気持ち悪い生物も結構我々と共通するところあるんだなあ、と思いましたね。
気持ち悪い生物、と言ったら失礼か。

個人的には、できればIso-SeqをP6C4でもやって欲しい。
もうやっていたりして。



2015年9月19日土曜日

PacBioでHLAシークエンス

先日、水戸で「日本組織適合性学会大会」があり、行ってきました。
以前からPacBioでHLA遺伝子をシークエンスしている先生の発表があったのと、この業界についてはほとんど素人だったので、勉強もかねて。学会についてはこちら

この学会では、輸血・臓器・造血といった、移植全般の「組織適合性」に関して、大学研究者から医療関係者、日本赤十字、現場のティシュータイパー、といった方々が集まって最新の技術を発表したり、現場の問題点を提起したり、活発に議論が交わされていました。

企業からもタイピング受託会社や、タイピング装置やキットの輸入商社、メーカーなどが参加。
学会の規模は、そうですね、実感としては「ゲノム微生物学会」くらいの大きさかな。

さて、HLAについて、もし基礎的なバックグラウンドを知りたいかたは、先ほどの学会ホームページのここがとても詳しいです。
私もこのページで勉強しました。

ざっくり言うと、移植のときなどにドナーとレシピアントとの間で、適合するかどうか、は、HLAという遺伝子のSNPの型で決めるんです。
ひとつの遺伝子にSNPがいくつもあって、その組み合わせで、何千通りというハプロタイプができる。
HLAはA、B、C、DRB、DQB、DPBなどなどいくつかあり、タイピングに用いられる遺伝子はだいたい決まっています。

その遺伝子のSNP型を、ビーズ、PCR、またはシークエンスで判定するということ。

今、HLAタイピングの主流はビーズです。
その理由は、①簡単、②低コスト、③世界中でバリデートされている
から。
ビーズで検出すると、同じ遺伝子上でも離れた場所にある2つのSNPのハプロタイプはわからない。
これをAmbiguity問題、といいます。
シークエンス法に比べると、精度は落ちる。

GenDX社のウェブサイトから
シークエンス法の場合、先ず一旦遺伝子の全長、または変異の高い場所をPCR増幅します。
プライマーはもちろん保存された領域に設定される。
このプライマーでちゃんと増えたら、次に断片化する。
断片化した後、シークエンスする場所を濃縮するか、あるいはそのままシークエンスする。

あれ? 何で断片化するの?
と思ったかた、あなたの頭はPacBio向きです。

PCRで増幅したHLA遺伝子は、だいたい4kbから10kbかそれより少し長いくらい。
PacBioならそのまま読めますよね。
そうです。読めます。
断片化するのは、ショートリードのときだけ。

NGSとHLAタイピングをもっと詳しく知りたい!という方はこのレビューがおすすめ

Hosomichi et al., (2015) The impact of next-generation sequencing technologies on HLA research. J of Human Genetics.

HLAタイピングの方法、ソフトウェアの種類、長所短所などがまとめられています。

シークエンスされたデータは、IMGT/HLAデータベースに登録されている各HLA遺伝子の配列にマッピングされます。マッピングのアルゴリズムは、ツールごとにいろいろあるようです。
有償ソフトウェアなどは各社独自のマッピング方法を開発して、精度を上げています。
そして、アレルごとにコンセンサスを出して、アレルの型を決める
Hosomichi et al. (2015)

PacBioの場合も、長いリードで遺伝子全体を読みますが、そのあとデノボでクラスタリングをつくり、アレルごとにコンセンサス配列を作ります。
先にデータベースにマッピングするのではなく、アレルごとの遺伝子全体のコンセンサス配列をつくってから、データベースを参照して型を判定するのです。
(正確には、遺伝子全体を読むのはClass Iと呼ばれる比較的短い、とはいっても5kbくらい、の遺伝子。Class IIと呼ばれる遺伝子群は、10kb以上あるが、それくらい長いとPCRすること自体が難しい。そこで遺伝子の一部を増幅することが多い)


このように、NGS、特にPacBioで読めば、Ambiguity無しに、正確なHLA型を判定することが可能です。
でも、タイピングにかかるコストは若干高め。
ライブラリ作製にかかる手間は、ビーズ法に比べれば、かかる。これは認めます。

では、どういう場合に、PacBioがHLAタイピングに使用されているのか?

アメリカには、Histogenetics社という、HLAタイピングの専門会社があります。
この会社はMiSeqを47台、PacBioを1台保有し(もちろんキャピラリーはたっくさん保有)、Sequence Based Typing (SBT)をガンガンやっています。
顧客は主にNMDP(National Marrow Donor Program)のようなバンク。
MiSeqを使ったタイピングでもキャピラリーを使ったタイピングでも、データベースに合わなかったり新規の可能性があるような場合、PacBioの登場。
昨年はまだ慣れていなかったテクニシャンも、もうPacBioかんたーん!って言っているそうです(Histogenetics社のCEO曰く)。
タイピングの方法も、自分たちで作ったデータベースに独自のプログラムを使って、行なっているとのこと。
ここはPacBioでのHLAシークエンスに一番ノウハウがあると思いますが、いかんせん、企業なので情報はあまり出てこない。

では、イギリスのAnthony Nolanはどうかな?ここは公共機関。論文もあります。
Mayor et al., (2015) HLA Typing for the Next Generation. PLOS One.

新しいアレルも発見されています
Hayward et al., (2015) The novel HLA-B*44 allele, HLA-B*44:220, identified by Single Molecule Real-Time DNA sequencing in a British Caucasoid male. Tissue Antigens.

人類遺伝学会などでも関連する発表がありそうな予感。
PacBioの可能性が試されるときです!