ヒトのゲノムはつくれるのか?
2016年6月、「The Genome Project-Write」なる壮大な計画が科学雑誌「Science」に発表されました(下参照)。新聞やネットニュースなどでも取り上げられたので、生物・生命科学に興味をもっている高校生は目にしたかもしれません。この計画の最終目的は、“ヒトゲノムの(完全)人工合成とそれを細胞に導入して人工ゲノムをもつ細胞を作る”というものです。ハリウッド映画のジュラシックパークほどではないにしろ、かなりインパクトがありますね。本当に可能なのでしょうか?ここでは、そこに至るまでの歴史的・技術的背景を解説しながら、この計画がもたらす未来と問題について考えてみることにします。
2016年Science誌より
ヒトゲノム計画 ~Human Genome Project -Read~
最初に、「The Genome Project-Write」がシャレを利かせたタイトルであることを理解して貰うためヒトゲノム計画について紹介しましょう。ヒトゲノム計画とは、ヒト細胞の核内にあるDNAの全塩基配列を解読することを目的として、アメリカ政府が1990年から15年間で30億ドル(4320億円!!(=1990年円相場での換算額))の予算を組んで発足した研究計画でした。完成すれば凄い偉業ですが、やることは単純で長大な全DNAの塩基配列を決めれば良いわけですから人海戦術でいけそうですよね。当然、世界各国がこの偉業に参加するべく支援を申し入れあっという間に国際研究プロジェクトとなりました。苦労話は後ほど語るとして、実際の成果はどうだったかというと、2000年6月にドラフトゲノム(全体の約90%が解読された状態)が公表され、2003年4月に完成版が公開されました(その後、現在までマイナーアップデートは続いています)。こうして決められたヒトの全ゲノムですが「解読("READ")」ですので、次は”WRITE”という訳です。
さて、15年の予定が13年で解析された訳ですからさぞかしスムーズに運んだと思われそうですが、いろいろと苦労は尽きませんでした。当時の塩基配列を決定する方法(サンガーシークエンス法と呼ばれます)では、一度に解読できるDNA長は500~700塩基程度でした(図1)。従って、大規模な塩基配列決定が可能な機器の開発も必要でした。一度に16個~32個の検体を同時に解析でき、塩基配列を決めたいサンプルをセットさえしておけば、無人で昼夜を問わず連続運転する機械の登場により、解読速度は飛躍的に上がりました。
図1.サンガーシークエンス法の原理
それでもまだ問題がありました。元々長大なDNAの一部を切り分けて500〜700(後には1000近くまで読めるようになりました)塩基ずつ解読するわけですから、前後のつながりを分かるようにしなければなりません。最終的にヒトの場合だと22本の常染色体とXとY染色体の計24本の染色体に相当する24本の長いDNA配列として繋げなければなりませんので、適当にバラバラにしたものを片っ端から読んでは前後関係が分からなくなってしまい、繋げようがありません。そこで人工染色体など大きなDNA断片を保持できるシステムや、それよりも小さいDNAを保持できるコスミド、フォスミド、プラスミドなどを利用して、段階的にDNAを断片化して、前後の繋がりを判定できる状態にして塩基配列を決めました(図2)。
図2.ゲノムシークエンス時のゲノムDNA断片化様式
こうして読み取られた最初のヒトゲノムは、総塩基数が約30億(3Gb:ギガ塩基)、遺伝子数が約26000と報告され、さらに全遺伝子の99%の配列を99.99%の正確さで含むと言われていました。実際に、このゲノムを明らかにするために、読まれた塩基数はいくつかというと、約43Gbだと言われています。単純な研究コストを算出してみると、43Gb/4320億円ですので、100億円/1Gb(10億塩基)、つまり、1塩基10円となります。総額を聞くとびっくりするような額ですが、1塩基当たりにすると安い!となるでしょうか?
ポストゲノム時代の幕開け
こうしてヒトゲノムが明らかになった頃、他の実験モデル動物、植物でも次々と全ゲノム解読が進んでいました。そして、ゲノム科学業界は、ゲノムを明らかにした後の、次なる一手を模索し始めました。それがポスト( “後”という意味です)ゲノムと呼ばれる時代の幕開けでした。ゲノム計画によりほぼ全ての遺伝子が釣り上げられたことから、次なる一手の1つ目は、全遺伝子の百科事典化でした。全ての遺伝子が、どんな細胞・組織で、いつ(胚発生途中か?成人後か?健常時か疾病時か?など)、どのように機能しているかを全て明らかにしましょうというものでした。実際には、健常人の組織、株化された培養細胞、がん等の患者さんから樹立された異常を伴った細胞など、様々な細胞サンプルにおいて、26000個と推定された遺伝子の何が、どれくらい発現しているか?を解析するというものでした。これは後にエンサイクロペディア計画~ENCODE~(ネットだとウィキペディアが有名になりましたが)として、2014年まで推進されました。その成果は、世界的に有名な一流科学雑誌を含む30報にも及ぶ論文としてまとめられていますので、興味のある方は是非ご覧ください。もう一つが、1000人ゲノム計画というものです。ヒトゲノム計画の国際チームでは、個人情報保護のため男女20人からDNAを採取し、その中からランダムに選ばれた男女2名分のサンプルを用いて塩基配列を決定しました。実際には一方のサンプルを主として用いたため、実質的には男女各1人のゲノムを解読したことになります。当時から、ヒトの間でも多くの塩基配列に多型が生じていること、さらにそれらが個性や特定の病気の罹患率に影響することも明らかになっていたため、2008年より1000人分のゲノムを解読し、様々な個性に関わる塩基の多型を網羅的に明らかにしようという計画が始まりました。こちらも詳しいことが知りたい方は、「
http://www.internationalgenome.org/home」をご参照ください。いずれの場合でも、ヒトゲノム計画と同じように、大規模な塩基配列の更なる解読を前提とした研究でした。そこで現れたのが「次世代」と呼ばれる塩基配列解析装置でした。
現代の黒船?次世代シークエンサー
こうして、一つの大きな成果が、次なる壮大な研究プロジェクトへ繋がる大きなうねりの中、次世代シークエンサーは世のゲノム研究者の羨望と期待を一身に集めて登場しました。「次世代」という言葉は、サンガー法(上述)の塩基配列決定法からみて次の世代という意味ですが、次世代シークエンサーも登場から10年以上が経過し、様々な方法論の次世代シークエンサーが複数現れました。現在は次世代の中でも第二、第三世代と呼ばれる機械が主役となっています。次世代シークエンサーは、その配列決定の方法論がサンガー法とは全く異なっています。その最大の特徴は、短いDNA鎖の塩基配列を、同時並行で超大量に解析できるというものです。その処理能力は絶大で、最新機器で1回シークエンス解析を行って得られるDNAの総塩基数は驚愕の1Tb(テラ塩基=1000Gb)です。先ほど、ヒトゲノム計画にて13年間で解読した配列数が43Gbと言いましたが、当時から十数年しか経っていない現在はその23倍の塩基数を一週間程度で解読できるということです。しかも費用は300万円程度です(注意:この金額は配列データの取得だけであって、配列の並べ替えなどの配列解析には別途費用が掛かります)。こうして次世代シークエンサーが普及していくことでDNA塩基配列の解析処理速度、処理量は急速に増大し、逆にコストは急激に下がっていきました(図3)。次世代シークエンサーに関する詳しい解説を知りたい方は、イルミナ社のHPなどをご覧ください。
図3.DNA解読にかかるコストの経年変化(米NIHホームページより)
次世代シークエンサーの登場と普及により急激に低下した。
このように次世代シークエンサーによって、低コストで大量の配列データを取得可能になった訳ですが、解決すべき問題はまだありました。それは非常に小さい(180~250塩基対)DNA断片を用いて一気に配列を解読する網羅的な方法のため、各配列の前後の繋がり情報を維持できない点にあります。つまり、図2で示した問題を別の方法で解決する必要があった訳です。この点については、高性能のワークステーションやスーパーコンピューターを使ったソフトウェアレベルでの配列解析によって解決が試みられました。次世代シークエンサーでの塩基配列の決定は、簡単に言うと200bp程度の短いDNA断片の両端(または片端)の100bp程度の塩基配列を解読します。二重らせん構造のDNAの場合、180~200bpの断片の両端100bpずつ解読すれば、実質全長の配列が解読できることになります。このような断片が1回の解析で最大で50億本取得できます。これをコンピューター上に全て展開して(これをするには1Tbクラスのメモリが必要になる)、⼀つ⼀つの塩基配列を全て比較していき、端部の1塩基を除く残り全ての塩基配列が⼀致する配列だけを抽出し、1塩基ずつずらして並べていく。
このような処理を延々と続けることで、解読された塩基配列を繋げていき、元々の配列を推定していくわけです(図4)。
図4.次世代シークエンサーの塩基配列決定法
この工程はアセンブルと呼ばれ、アセンブル用に何種類ものプログラムが作成され、その精度も詳細に解析・改善が施され、現在では十分に信頼性の高いアセンブルが可能なソフトが数多く出回りました。こうして次世代シークエンサーと高精度アセンブルソフトウェアの組合せによって、高速・高精度、でも安価に全ゲノム解読が出来る時代が到来したわけです。
READからWRITEへ
このような歴史的経緯、技術革新によりゲノム科学は、ヒトゲノム計画が作案された1990年からわずか27年で、ムーアの法則を無視する破竹の勢いで進展してきました。すでにドラフトゲノムが登録されている生物は、真核生物で4000種を超えています。そして今、すでに解読(READ)の時代は終わったとばかりに、いよいよ創造(WRITE)へとゲノム科学の方向性は変遷しようとしているわけです。
さて、本当に実現は可能なのでしょうか?実は人工細菌なるものはすでに2010年にその姿を世に現しています。米国メリーランド州にあるクレイグ・ベンダー研究所のクレイグ・ベンダー博士は、マイコプラズマの一種のゲノム約100万塩基対のDNAを人工合成し、別種のマイコプラズマに導入し、この菌が人工合成ゲノムを利用して分裂・増殖することができることを証明しました。彼は、この菌を「コンピューターを親に持つ地球最初の自己複製細胞だ」と表現しました。その後、彼の研究所ではゲノムサイズを半分まで縮小した、生命維持に必要な最小ゲノムを持つ人工細菌も作製しています。人工細菌に関する詳しい内容が知りたい方は、「http://science.sciencemag.org/content/329/5987/52」をご覧ください。この成果は、自らの手で全く新しいゲノムをもつ生物を創造できる可能性を示したものとして、生物学、生命科学の分野では革新的な研究成果と言っても過言ではありません(ただし、倫理的問題等は非常に大きなものを抱えていることは否めません)。彼らは、この人工細菌を作るのに4000万ドルと15年の月日を費やし、その間の研究の99%が失敗の繰り返しだったと記者会見で述べていますが、この成果により合成生物学は「一大進歩」を遂げました。「失敗は成功の母」などと良く言いますが、まさに偉大な成功が膨大な数の失敗の中から生み出された瞬間ということになります。
このように次世代シークエンサーによる網羅的かつ高精度な塩基配列の解読に加え、人工的な長鎖DNAの合成技術が進展してきたことが、今回の「The Genome Project-Write」に繋がっているわけです。ヒトゲノムの1/3000スケールではありますが人工細菌が作れたという事実は、ヒト人工ゲノムをもつ細胞の樹立も可能であることを強く示唆しています。人工的に構築したゲノムDNAをもつ細胞計画は始まったばかりですから、これからの成果を楽しみにしたいと思います。
WRITEよりWAIT?
今回の計画の究極的なゴールの1つは「ヒト人工ゲノム細胞によるiPS細胞の代替」です。iPS細胞は、ES(胚性幹)細胞のように受精卵を使用する必要がなく(生命倫理に抵触することなく)、患者本人の組織から幹細胞を樹立できるため再生医療において現在最も注目されています(少し宣伝すると今年4月より生物学科にiPS細胞やES細胞を用いた再生医療の基礎研究を行っている教員が新たに着任されます)。しかし、樹立の過程(あるいは再生治療後)においてガン化する可能性をゼロに出来ないという問題が存在します。一方、人工ゲノムを持つ人工幹細胞であればガン化のリスクは回避できます。さらに移植医療において最大の問題となる「免疫適合性」に関するゲノム領域(該当遺伝子等)を排除した人工ゲノムを使用して人工幹細胞を1つ作ってしまえば、理論的には1つの人工細胞で、全人類の再生医療に応用できる可能性を持っているわけです。まさに夢のような細胞ということになります。また、エンサイクロペディア計画や1000人ゲノム計画により、ヒトゲノムの中に普遍的に存在する多型もほぼ全て明らかになってきました。この中には、ガンや脳・心臓疾患、生活習慣病等の罹患率と相関がみられる多型も数多く含まれます。従って、人工合成するゲノムを、これらのリスクを一切含まない配列でデザインすることも可能ということになります。まさにPERFECT HUMANならぬPERFECT CELLということになるでしょうか。ここまで書けば賢明な皆さんはお分かりになると思いますが、このような行為は、本来ヒトが手を出して良い領域なのか?という問題が生じます。ヒトがより優れたゲノムを持つヒトを作り出す、あるいはヒトでなくても別の生物を創造する、それは果たして許されるのか?科学者は技術(者)としてそれが可能かどうか理論・実践的に証明することを目的として研究を行いますが、それらの応用性についての議論を怠りがちです。病気になりにくいゲノムならまだ良いかも知れませんが、運動能力が極めて高くなるゲノム、天才を超えるような知性をもつようになるゲノム、寿命が10倍延長されるゲノム、はたまたまだ人類が目覚めていない(超?)能力を開花させるゲノム(アニメのような話ですが)、そういうモノを生み出す技術と情報は揃いつつあります。出来てからでは遅いのですから夢物語と思わず、そろそろ議論はした方が良いのかも知れません。
生物学科のゲノム科学の方向性
“ゲノム”にまつわる話は、他にもいろいろありますが、我々の研究室でも個体を構成する細胞間でダイナミックにゲノムDNAを再編成するという不思議な現象を行う「ヌタウナギ」という生物の研究を行っています。詳しい話は、以前の生物学の新知識『
ヌタウナギ−二つのゲノムと染色体放出』、『
生きた化石−ヌタウナギ』をご覧ください。とても興味深い現象です。そして、最近、私の所属する研究室でも次世代シークエンサーを用いた解析を始めました。このヌタウナギの「再編前のゲノム」と「再編後のゲノム」をそれぞれ次世代シークエンサーで解読・比較することで、何がどう変わったのか分かるだろうというアイデアです。ようやく成果も出てきましたので、次に生物学の新知識を担当するときにはご紹介できると思います。また、併せて当研究室では、これまでにもいくつかの天然記念物を含めた絶滅危惧種のゲノム・染色体研究をしてきたことから、今後、絶滅が危惧される希少種のゲノム解読を進めて行く予定です。そのため、この4月から研究室名を『ゲノム進化ダイナミクス研究室(Laboratory of Genome Dynamics and Evolution)』(
現研究室HPはこちら)へと変更します。この話を読んで“ゲノム科学”に興味を持った高校生諸君は、是非とも、
土曜キャンパス見学会、
オープンキャンパス等で後藤、久保田に会いに来て頂けたらと思います。東邦大学・理学部・生物学科で貴方もゲノム科学に没頭してみませんか?