植物分子生理学研究室
Lab for Plant Molecular Physiology, Fac Appl Biol Sci, Gifu University
論理的思考3
番外編 科学的思考
論理的思考法のネタが意外に早く尽きてしまったので、その親戚の「科学的思考」について紹介してみる。論理的思考は一歩一歩地道に歩くようなものだが、科学的思考ではときどき飛躍がある。飛躍によりできたギャップは後から論理的に埋めていく。地図もない密林を探検する際にドローンを使って遠くを見通すようなものである。ただし「心のドローン」を使うのであり、得られるパースペクティブも想像上のものになる。言うまでもないが、誰にでもできることではない。
前世紀の中頃には検証可能な仮説を尊ぶ風潮があったらしい。検証可能な「真の科学」と検証不能な「疑似(エセ)科学」を峻別しよう、ということかもしれない。私はその時代の雰囲気を体験したことがないのでよくは分からないが、古い本にときどき検証可能性を誇る場合があるのを見かける(マーギュリスの進化論1とか)。
とはいえ、「真の科学」と「疑似科学」は検証可能性を吟味しなければ区別できない、ということは全くなくて、チラ見の一瞬でわかるものである。「真の科学」の中にどっぷりと浸っていると、検証可能かどうかは実は気にならなくなる。特に技術的進歩が速い分野では「今は検証実験を組めないけれど、10年後には手が届くかも」みたいな「検証不能な」仮説はサイエンスとして筋が良いという印象を受けることもある。
科学的思考、基本的なことは置いておいて(改めて意識するのが難しいので...)、個人的に大事そうなことをいくつか挙げてみることにする。
その1 軸を通す
まずは雑多な知見を整理する話。論理的思考その1と若干似ているが、こちらは一気に行う。関連しそうな多数の知見を集めてそれをある仮説のもとにパラメーターを設定し、その軸空間へ知見をすべて収めて整理する。収まりの良さが仮説の正しさを示すことになる。
科学史上有名なのはメンデレーエフ先生の元素周期表の作成である(1870)。この周期表には見つかっているすべての元素が美しく(周期が見えたのである)収まった上に未知の元素の存在を「予言」しその後発見された(ガリウム、ゲルマニウム、スカンジウム)、というおまけまでついている。すばらしい。
(図)メンデレーエフの周期表:元素を原子量順に並べると気体、液体、固体、金属性が周期的に現れる(図はwikipediaより)。
余談になるが、ロシアの英雄メンデレーエフ先生には「ウォッカの最適なアルコール濃度を40%に決めた」という伝説がある。最適というのは味覚の観点からである。先生は水とエタノールの量比を少しづつ変えて賞味した結果40%が最もおいしいことを発見し、ウォッカのアルコール濃度は40%にすべし、と提言したとのこと。メンデレーエフ先生とウォッカの関係はロシア人なら誰でも知っている常識であるが、事実かどうかは若干疑問が残るらしい(「旅行者の朝食」米原万理著)。なので常識というよりは伝説と言ったほうがいいのかも知れない。ロシア人にこの疑問を投げかけるのは大変失礼なことになるらしいので要注意。
私は鉱物好きなので、組成と冷却速度が決まれば出来る岩石も決まってくるというシステマティックな実験結果をもとにしたマトリックスを目にしたのが今でも印象深い。中学生のころ何かの本にあったのを見た。組成一つに対して冷却速度を数種類適用する、そして組成を少し変えてまた冷却実験、という労力を要する実験であるが、出来上がったマトリックスの中に地表の岩石がほぼ収まってしまうところがすばらしい。
植物科学の分野でいえば、高校の教科書にも出てくる花のABCモデルが有名である(〜1990)。シロイヌナズナの花のホメオティック変異を収集しそれぞれの原因遺伝子の役割をモデル化したもので、大変シンプルでありつついくつもの変異を矛盾なく説明できる。具体的にはA、B、Cの3つの遺伝子が花の原基で発現しており、ABが発現している領域は花弁に、BCが発現している領域は雄しべになる、遺伝子Bが壊れるとABが発現すべきところがAだけになるので花弁になるべきところが萼に変わり、BCが発現すべきところがCだけになり雄しべが心皮に変わる、という3つの(実体のわからない)遺伝子の発現の組み合わせを仮定するだけで野生型と変異体の表現型を説明することができる。
近年では多数の文献に記載されている情報を統合的に解析する「メタ解析」という手法が現れている。 自分で実験はせず、論文に掲載されているデータを収集しそれらの再解釈のみで新しい知見や法則を得る、というのがメタ解析のスタイルである。
一例を挙げると、光合成の最重要酵素(ということは地球上の全生物の最重要酵素)であるCO2固定酵素(RuBisCO)について様々な光合成生物のアミノ酸配列とホスト生物の生育温度の関係を調べ、全長に渡って見られるアミノ酸変異と活性を持つ温度との相関を探る、というもの。別の例では数百の植物種についてのデータから1日の日射量と一個体が持つ葉面責(個体重に対する相対値)との間に負の相関があることを解明した、というものもある。要するに日射量が十分あると光合成装置の生産以外に作るものが多くなる(余裕ができるのだ)、という話であるが、多数の種の豊富なデータを元に示された一般則ということになる(なので「私はこう感じている」という個人の自然観の話とは別物である)。
230413 追記:もう少し身近な題材で解析してみた >> 「苗字」
その2 データに基づく状況解析
科学的方法が感性に基づく方法といちばん違うのは、データに基づいている(data driven)というところである。信頼できるデータに論理を入れれば、誰もが納得する結論が出てくる。
まずはデータに基づかない状況認識から。例えば最近発売された四角い四駆オフロードカーのドライバーが若い女性なのを見かけた、とする。そういえばあの車は人気が高くて予約しても1年待ちだとか聞いたことがある。メーカーのwebサイトを見ると女性にフォーカスしているようだ(〇〇女子とか言ってる)。ということで、その四駆車は女性に大人気なのだ、無骨なデザインが逆に若い女性にウケたのだ、と結論づけるのが「個人の感覚に基づく認識」である。
データに基づく場合は、「本当に売れているのか?」「本当に特に女性に売れているのか?」と疑うところから始まる。購入者の女性の割合を調べて他の車種と比較する。あるいは、運転者を調べる手もある。車と運転手が両方写っている写真をたくさん(1000枚程度では少ないのでもう数桁多い方が結果が安定しそう、ということは10万枚以上ということになるかも)集めて、車種ごとに女性ドライバーの割合を算出する。購入者と運転者は同じとは限らないので、両方調べておくと確実である。これらの情報から件の四駆車に限って女性の割合が高いなら確かに「女性に売れている」もしくは「女性に人気(女性ドライバーの割合が多い)」ということになる。無骨なデザインとの関係については別のデータを集めて解析するまでは結論を出さない。
感覚的な認識とデータに基づく認識を並べてみれば、前者は「ただの個人的な思い込みで実際には違うのではないか」という疑念を払拭できないことに気がつかれると思う。サイエンスの世界ではデータに基づかない結論は結論としては認められずに仮説、もしくは空想という扱いになる。根拠はわからないが偉い先生が言ってるのだから本当ではないか、というのはサイエンスではナシである。偉い先生でも元になるデータを見せなければ説得力は得られない。
ついでにいうと、データの集め方にも作法がある。集める方法は公開し万人の批判に耐えるものでなければならない。サイエンスの世界で最も嫌われるのはバイアスのかかった集め方である。偏ったデータは間違った結論に繋がる可能性がある。間違った結論は何としても避けたいのがサイエンスである。
ジュラシックパークの原作者としておなじみのマイケルクライトンに「アンドロメダ病原体」という古典SFの名作がある(1969、ハヤカワ文庫に翻訳あり)。作品を通してデータに基づいて合理的な判断と対策が行われていくのであるが、出発点のデータがSFなので意表をつくところへ連れていかれるのが面白い。理系の人のデータとの付き合い方について参考になるかも知れない。ちなみに著者は医学の博士号(MD)を持つ理系の人である。
(もうすこしつづく)
注1)検証した訳ではない。
2021.12.1
Highly Cited Researchers of Gifu University