特集:発見の科学
機械はアインシュタインになれるか

久保田啓介(日本経済新聞記者)
200205

日経サイエンス 2002年5月号

2ページ
( 1.5MB )
コンテンツ価格: 407

1900年,ドイツの物理学者プランク(Max K. E. Planck)は自然界にはエネルギーや電気量などが飛び飛びの値(単位量の整数倍)しかとらない現象があることを発見し,「量子仮説」を提唱した。これが端緒になって量子力学が花開き,現代の科学技術に大きな影響を与えることになる。ニュートン(Isaac Newton)以来の古典物理学を変革し,人類の世界観を変えたとすらいえるこの大発見は,何をヒントに生まれたのだろうか。
  
発見を支える「類推」「隠喩」
 科学史家のクーン(Thomas Kuhn)によると,プランクは音響学で使われた「共鳴子」という概念からの類推で量子仮説のヒントを得たという。プランクは当時,黒体(あらゆる波長の電磁波を吸収する物体)が熱を放出する「黒体放射」という現象を研究していた。これを共鳴子の概念を借りて説明しようと試み,共鳴子のエネルギーが単位量の整数倍にしかならないことに気づく。それが量子という新しい概念の導入につながったのだという。
 東北大学文学部の野家啓一(のえ・けいいち)教授は「科学的発見の過程では類推や隠喩(メタファー)が重要な役割を担っている」と指摘する。科学的発見の多くは変則的な事例に気づくことから始まる。19世紀初め,ファラデー(Michael Faraday)が電磁誘導を発見したのも,ほかの科学者なら「実験ミス」と思いこんでしまうような変則事例に注目したからだった。
 「変則事例に遭遇したとき,旧来の概念を隠喩として利用したり,そこからの類推で新しいアイデアを表現する。科学の枠組みを大きく変えるような発見では,隠喩は理論的な展望を切り開くのに不可欠な手段だ」と野家教授は話す。
 では,類推や隠喩の働きをもつコンピューターが実現すれば,人間のように科学的な発見ができるのか――。こんな疑問を出発点にした研究が最近活発になってきた。九州大学の有川節夫(ありかわ・せつお)教授が1990年代半ばに提唱した「発見科学」という新しい研究領域がその代表だ。
  
発見を支援する計算機
 近年,テラ(1テラは1兆)バイトを超えるような大容量記憶装置が普及し,きわめて大量のデータを収集したり蓄積できるようになった。大量のデータを超高速コンピューターで解析し,通常のデータ分析では発見できない“隠れた法則”や相関関係を導き出す研究も進展している。「これらの技術を駆使して,科学的な発見を支援する計算機を開発する」(有川教授)のが発見科学の目標だ。
 1998年,文部省(現文部科学省)の科学研究費補助金に基づいて「巨大学術社会情報からの知識発見に関する基礎研究(通称,発見科学)」と題する大掛かりな研究計画が始動。人工知能(AI)や統計科学,哲学,論理学など関連分野からおよそ60人の研究者が参加し,「知識を発見する機械」の開発に取り組んできた。計画は2001年3月に終了したが,さまざまな成果を生み出しつつある。
  
「紙おむつとビールの法則」
 そのひとつが,膨大なデータの“鉱脈”から新しい知識を掘り出すデータマイニングの進展だ。この手法そのものは1990年代半ばに米国で研究が先行し,ビジネスでも盛んに応用されてきた。とりわけ小売・サービス業では販売時点情報管理(POS)システムなどで集めた大量のデータを分析し,販売戦略を立案する手法として大きな注目を集めている。
 なかでも有名なのが「金曜日の午後には缶ビールと紙おむつを一緒に買う女性客が増える」「コーヒー豆のブルーマウンテンを買う客は高額な輸入商品も併せて買う」といった“法則”の発見だ。流通業界ではこれに注目して缶ビールと紙おむつを隣どうしに並べて売り上げを増やしたり,ブルーマウンテンを大幅に値引きして客を集め,高額商品の販売増につなげるといった巧妙な販促手法も登場した。
 データマイニングは理工学分野でも急速に広がりつつある。生物の塩基配列の膨大なデータから病気の原因になる遺伝子を割り出したり,疾患につながるさまざまな因子をあぶり出す研究が急進展している。地球物理学でも過去の地震のデータをしらみつぶしに調べ,未知の活断層が突き止められた。熟練した研究者のカンや経験,職人芸を頼りとする従来の分析手法は,もはや時代遅れになろうとしている。
  
カギ握る「論駁可能性」
 さらに重要なのが,「発見を支援するコンピューター」の理論的研究が加速していることだ。
 消費者の購買パターンや遺伝子の塩基配列といった具体的なデータをたくさん集め,そこから一般的なルールを導き出す思考過程を「帰納推論」と呼ぶ。データマイニングでもよく使われる手法だ。ただ,「紙おむつと缶ビールの法則」などの事例は,人間が担っている高度で複雑な発見のプロセスの一端にすぎない。
 量子説をみるまでもなく,科学者による「発見」とは,抽象的な概念どうしを結びつける理論や,普遍性をもつ法則の発見など広範囲に及ぶ。一方,従来のデータマイニングはこれに比べると初歩的なうえ,「高額商品」といったデータ属性を事前に分類・定義づけした時点で,人間の「仮説」がまぎれこんでいる可能性も捨てきれない。機械にデータだけを与えて,本当に科学的発見を導き出せるのだろうか。
 有川教授は機械による発見を実現するカギとして,「論駁(ろんばく)可能性」という概念に注目している。科学理論の発見プロセスを哲学・論理学的に分析し,それをコンピューターのアルゴリズム(計算手順)に組み込もうという発想だ。
 哲学者のポッパー(Karl Popper)は「科学的理論とは観測・実験データによって反証(論駁)可能なものでなければならない」と主張した。科学者がある仮説(推測)を打ち出し,それが観測・実験データと矛盾すれば,仮説は再構築を迫られる。仮説づくりとデータによる反証という絶えざる連鎖は科学的発見の基本プロセスだ。
 有川教授によると,隠れた仮説の候補群(これを仮説空間という)と実験・観測データをコンピューターに同時に与え,データによって反証すれば,科学理論を発見できるという。データの関連性を説明する仮説が存在しなければ,別の仮説空間をコンピューターに与えて再び発見を試みればよい。有川教授は「仮説空間を論駁するプロセスをアルゴリズムに組み込めば,あとは出力を待つだけでよい。機械でも高度な発見が可能だ」と主張する。
  
発見の本質に迫る
 「発見を支援する機械」の研究はひるがえって,人間による発見の本質にも迫ろうとしている。人間の思考プロセスの解明は認知科学やAI,脳研究などさまざまな切り口から進展しているが,「発見」という特定の機能に的を絞った研究はあまり注目されてこなかった。有川教授は「哲学者や論理学者が“発見とは何か”に関心をもつようになった意義は大きい」と話す。
 最近,発見科学の研究者や哲学者が注目しているのが「セレンディピティー(serendipity)」という言葉だ。「当てにしていないものを偶然見つける才能」「思いがけない発見」という意味で,最近では,ノーベル化学賞を受賞した白川英樹(しらかわ・ひでき)筑波大学名誉教授が触媒の量を間違えて実験したことが導電性高分子の発見につながったというエピソードが有名になった。
 機械は触媒の量を間違えたりしないが,意図的に間違いをするコンピューターを開発しようというアイデアはすでにある。セレンディピティーが文字通り偶然によるものなのか,背後に論理的な思考があるからこそ“偶然”が意味をもってくるのか。「発見の科学」がそれを明らかにしてくれる日が来るかもしれない。
  
  
もっと知るには…
『発見科学とデータマイニング』森下真一・宮野悟編,共立出版,2001年。
『セレンディピティー 思いがけない発見・発明のドラマ』R. ロバーツ著,安藤喬志訳,化学同人,1993年。
(全文を掲載しています。)