特集:発見の科学
生命に迫るバイオインフォマティクス

詫摩雅子(編集部)
200205

日経サイエンス 2002年5月号

4ページ
( 1.6MB )
コンテンツ価格: 509

「最初の生命の遺伝情報はDNAではなく,RNAに書かれていたらしい」「生命にとって必要最低限の遺伝子は256個」──米国立衛生研究所(NIH)のクーニン(Eugene V. Koonin)が打ち出した仮説だ。特筆すべきは,どちらも公開データベースに入ったゲノム情報から導かれた仮説という点だ。実験や観察をしなくても,生命の根幹に迫る発見が可能になりつつある。
  
膨大なデータから探し出す
 従来の医学・生物学ではそれほど大量のデータを扱うことはなかった。状況が一変したのは,ヒトゲノム計画を代表例とするDNAの塩基配列解析が始まってからだ。
 ヒトゲノムの塩基配列を読む作業は実験室での操作が不可欠だが,読み終わった配列から遺伝子を探し出す作業はもっぱらコンピューターがした。30億の塩基対のうち,意味のある遺伝子の領域は全体の5%程度。どの部分が遺伝子なのかを探し出すのは人間にはとてもできない。文字数が多い上に,4種類の文字しかないので,意味のあるパターンかどうかを見極めるのは不可能に近い。
 遺伝子として機能するのに必要不可欠な塩基配列のセット(プロモーターや転写開始・終了の合図となる配列など)をコンピューターに覚え込ませ,その条件に合う領域を探し出させる。東京医科歯科大学情報医科学センターの田中博(たなか・ひろし)センター長はこうした「遺伝子の探索」を第一世代のバイオインフォマティクスと位置づける。
 第一世代のもう1つの例は「ホモロジー探索」と呼ばれる“似たもの”探しだ。例えばヒトで新たな遺伝子が見つかったときに,塩基配列の似た遺伝子(ホモロジー)がほかの生物にないかをデータベースから探し出す。マウスなどで同じ遺伝子が見つかれば,その遺伝子の機能を実験で確認できる。
  
探索から発見へ
 第一世代のバイオインフォマティクスの特徴は「より速くより正確に」を追究したプログラミングの学問であることだ。遺伝子の探索については,決定版といえる探索ソフトはなく,複数のソフトを併用している。バイオインフォマティクスがプログラム学から脱皮したのは,冒頭で紹介したような成果や,最近急成長を遂げているDNAチップを使った第二世代の研究が出始めてからだろう。第二世代での目標は「比較ゲノム学」「システムバイオロジー」などだと田中センター長はいう。
 比較ゲノム学は,複数の生物種でゲノムを比較することで,進化を探るのが目的だ。冒頭のクーニンの業績も,比較ゲノム学に入るだろう。1995年以降,病原菌を中心にさまざまな生物のゲノム情報が続々と公開された。クーニンはこうしたデータを使って,複数の生物種でゲノムの比較をした。その結果,非常に面白い発見があった。
 現在の生物は核の構造などから大きく3グループに分かれる。大腸菌などの「細菌(真正細菌)」,熱水鉱床や塩湖などにすむ「古細菌」,酵母などの一部の単細胞生物とすべての多細胞生物を含む「真核生物」だ(ウイルスは自己増殖能力がないので,厳密な意味では生物ではない)。これまでの研究から,細菌のグループがまず分かれ,その後,古細菌と真核生物が分かれたと考えられている。3グループとも遺伝情報を書き込んで次世代に渡す物質としてDNAを使っている。
 しかし,DNAの合成に関係する酵素の遺伝子を調べると,古細菌・真核生物のグループと細菌のグループとで,あまり共通性が見られなかった。一方で,RNA関連酵素の遺伝子はよく似ていた。この結果を単純に解釈すれば,3グループの共通の祖先はRNAを基盤とした生物と推測できる。
 1980年代に酵素機能をもつRNAをチェック(Thomas Cech)が発見して以来,最初の生命はRNA基盤という考えが浸透してきたが,クーニンの研究はそれを裏付ける結果となった。
 生命にとって必要最低限の遺伝子数の研究は,肺炎などを引き起こすマイコプラズマなどのゲノムから遺伝子を詳細に調べた成果だ。“詳細に調べた”といっても,遺伝子の機能を実験で調べたわけではなく,塩基配列を丹念に見ていった。
 生物のゲノムを見ると,同じ配列の遺伝子が複数見つかることがよくある。マイコプラズマの遺伝子数は480個と極めて少ないが,それでも重複している遺伝子があった。それを除いていくと,256個あれば,生命としてやっていけるとクーニンは結論づけた。
  
大量の遺伝子を一度に解析
 第二世代として田中センター長が挙げたもう1つの例,「システムバイオロジー」を紹介しよう。例えば,細胞がガン化するとまるでまったく別の細胞になったかのようにガラリと変化する。正常な細胞ではそれほど作られていなかったタンパク質が大量に作られたり,逆に,これまで作られていたタンパク質が作られなくなったりする。病理学の世界では,ガン細胞への変化を形態の変化として見てきたが,細胞内のシステムが変化したととらえるべきだと田中センター長はいう。
 細胞内の何がどう変わったかを知るには,従来なら遺伝子ひとつひとつについて,それが発現している(タンパク質を作っている)かどうかを調べていた。しかし,現在ではDNAチップを使って,数千個から万単位の遺伝子を一度に調べることが可能になった。
 下の上図は東京大学先端科学技術研究センターの油谷浩幸(あぶらたに・ひろゆき)教授が調べた胃ガン細胞と正常な胃の細胞を比較した研究だ。22人の胃ガン患者から採った胃ガン細胞と8つの正常細胞で,発現している遺伝子を調べたものだ。工業製品と違って細胞はひとつひとつのばらつきが大きいから,データをそのまま見ているだけでは傾向がつかめない。しかし,コンピューター処理をして,発現パターンが似たもの同士をまとめる操作をすると,傾向が見えてくる。
 正常細胞では盛んに発現している遺伝子群(左下の一群の赤色)やあまり発現していない遺伝子群(下の真ん中あたり)があるが,ガン細胞ではこのパターンが逆になる傾向が読みとれる。さらに,胃ガン細胞でもリンパ節への転移を起こした患者の細胞と転移をしていない患者の細胞でもパターンが違う(下の下図)。
 こうした研究から,ガン化した細胞ではいったい何が起きているのかが詳しくわかるようになるはずだ。さらに,現在は“胃ガン”と一括りにされている病気もタイプ分けして,それに合った治療が可能になるだろう。
 システムが変わるのは,ガン化などの非常事態だけではない。発生段階で未分化の細胞が特定の種類の細胞へと変わっていくときにも,システムは変わるし,薬を投与されただけでも変化がある。医療応用への道筋がわかりやすい,薬の例を紹介しよう。
 薬を使うと良くはなるが完全には治らない場合が多い。その薬がどこに効いて,どこに効いていないのかがわかれば,薬の改良や他の薬との併用法を開発できる。DNAチップを使えば,数百や数千個の遺伝子の発現をいっぺんに調べられる。
 油谷教授は病気のモデル動物を使って,こうした研究もしている。健康なマウス,病気のモデルマウス,薬Aを投与した病気マウス,薬Bを投与した病気マウスの4つのグループで,多数の遺伝子の発現を比較するのだ。
 例えば,下の表のような結果が出たとしよう。健康なマウスを100とすると,遺伝子aの発現量は,病気のマウスで20,薬Aで90,薬Bで25。すると,この遺伝子aに関しては,薬Aは効いているが,薬Bはあまり効果がないとわかる。一方,遺伝子bは,健康なマウスでも病気のマウスでも100なのに,薬Aで30,薬Bで95になったとすると,薬Aでは副作用が起きていると解釈できる。
 薬Aで効果がない部分がわかれば,そこに効く薬を開発して併用すればいい。また,副作用が起きているとわかれば,薬Aを改良して同じ手順で確かめればよい。
  
遺伝子の機能を探る
 ヒトの遺伝子の数は3万?4万個とされるが,そのうち機能がわかっているのはせいぜい1割程度しかない。残りの遺伝子の機能を調べることは,生命科学の急務のひとつとなっている。
 これには,いくつかのアプローチがある。ひとつは,ホモロジー探索に似た手法だ。すでに機能のわかっている遺伝子と似た配列をしていれば,タンパク質の立体構造も似ていて,機能も似ていると推測する。
 タンパク質は複雑な3次元構造をしているが,その構造パターンはだいたい1000グループに分けられると考えられている。各グループから代表例を選び,それの立体構造をX線結晶構造解析などで丹念に調べ,データベース化しておく。現在はまだデータベースを作っている段階だが,将来は,機能のわからない遺伝子でも,ホモロジー探索の手法で似た配列から機能を推測できるようになるはずだ。
 また,DNAチップを使ったやり方もある。例えば,細胞分裂の各段階で時間を追いながら遺伝子の発現パターンを調べる。すでに機能のわかっている遺伝子と同じパターンをした遺伝子があれば,既知の遺伝子と何らかのかかわりのある遺伝子だと見当を付けることができる。
  
期待される医療応用
 ヒトゲノム計画の成果として,最も期待されているのはおそらく医療への応用だろう。キーワードになっているのは「テーラーメード医療」だ。ヒトゲノムの解読作業をしている際に,およそ1000塩基に1つの割合で,塩基配列に個人差があることがわかった。一卵性双生児を除けば,個人個人がもつ遺伝情報は少しずつ違っている。こうしたDNAレベルでの個人差が,いわゆる体質を決めている。
 たいていの薬は,患者の体内であるタンパク質に結合することで効力を発揮する。遺伝子のわずかな違いはタンパク質の形の違いとなることがある。形が違うために,薬が結合できなければ,その人にいくら投与しても効果は期待できない。
 また,高血圧や糖尿病になりやすい体質というのもある。こうしたありふれた病気では,複数の遺伝子がかかわっていると考えられている。どんなタイプの遺伝子をどういう組み合わせでもつとその病気になるリスクがどのくらい高くなるか,といった研究が進んでいる(村松正明「遺伝子の個人差を医療に生かす」日経サイエンス2002年1月号参照)。こうした研究を支えているのも,バイオインフォマティクスの手法だ。
  
バイオビジネスだけではない
 バイオインフォマティクスは,バイオビジネスの枠組みで語られることが多いが,それだけではない。冒頭の研究のように,生命像や進化の謎についてもヒントを与えてくれる。
 ゲノムの中から遺伝子を探し出すのは第一世代のバイオインフォマティクスだと述べたが,この成果からある大きな謎が浮かんできている。まずは,右ページの2枚の写真を見ていただきたい。生物学の実験に古くから使われてきたショウジョウバエと線虫だ。一見して,ショウジョウバエの方がはるかに複雑な体をした生物であるとわかるだろう。しかし,遺伝子の数はショウジョウバエは約1万4000個,線虫は約1万6000個と,線虫の方がわずかながら多い。体の複雑さや進化系統樹での“高等さ”と遺伝子の数とは必ずしも関係ないようだ。
 長年,集団遺伝学者として遺伝子を見てきた総合研究大学院大学の高畑尚之(たかはた・なおゆき)副学長は,“ヒトだけがもつ遺伝子”は存在せず,むしろ,ヒトだけが失ってしまった遺伝子が進化では重要だと考えている。高畑副学長が注目している遺伝子は,類人猿にはあるがヒトでは痕跡だけになっている。この遺伝子の詳しい機能はわかっていないが,類人猿やほかの動物では脳を除いて,体のいたるところで発現しているという。
 高畑副学長は,生物の進化ではある時点を境に,“新しい遺伝子”は作られなくなったと考えている。新しい遺伝子とは,既存の遺伝子のコピーや配列が少し変わっただけのものではなく,本当の意味での新しい遺伝子だ。例えば,ヒトのヘモグロビン遺伝子はチンパンジーのヘモグロビン遺伝子とは配列の一部が異なる。しかし,それはヒトでは配列が少し違うだけで“ヒトだけがもつ遺伝子”ではない。
 高畑副学長は,遺伝子を失うような進化の方向が可能になったのは,他の生物との共存がゲノムに影響を与えたからだと考えている。類人猿のゲノム解読は途中なので,推論に過ぎないことを高畑副学長自身が強調している。しかし,遺伝子を失うことで種は独自性を進化させたというのは,これまでにはなかった視点だ。この視点は高畑副学長の進化への深い洞察から出たものだが,仮説の根拠となっているのは,比較ゲノム学の成果からきている。仮説の検証にも比較ゲノム学が使われるだろう。
  
  
人がいないと意味がない
医学・生物学が情報工学と出会ったおかげで,従来では考えられないような大量のデータを処理できるようになり,次々と新しい成果を出しつつある。そうした成果はいずれ医療にも生かされるようになるだろう。それだけではなく,「生命とは何か」「進化とは何か」といった謎にも答えを出してくれるかもしれない。それには,ゲノム情報などのデータベース,仮説に基づいたデータマイニング,膨大なデータを処理するコンピューターとプログラム,そして,その結果を見て発見をする科学者の存在が不可欠だ。
 バイオインフォマティクスに関する著作も多い田中センター長は,仮説を立てる研究者や結果を解釈する研究者の重要性を強調する。バイオインフォマティクスは強力な手法だが,それを利用する者の知恵と知識が科学を支えている点を忘れてはならない。
(全文を掲載しています。)