2009年03月14日

メンデルvsフィッシャー?

(※2016/8追記)Fisherより指摘されたデータのバイアスは確認されなかったということで決着が付いています(cf. https://en.m.wikipedia.org/wiki/Gregor_Mendel#Controversy However, reproduction of the experiments has demonstrated that there is no real bias towards Mendel's data.以下を参照)。

メンデルの法則といえば高校生物でおなじみの優勢・分離・独立の3つの法則のことだが、これの元になった実験については 「データがあまりに都合のいい数値である」という批判があることは有名だ。

要するに、メンデルの法則が正しいかどうかはさておいて、メンデルの実験には捏造疑惑があるのだ(もちろん、 メンデルの法則がいくつかの例外を除いて、 あるいは例外についても適当な説明方法によって正しいということが主張できるのは周知のとおりだが)。

しかし、日本植物整理学会の「みんなのひろば」という一般の人からの質問に答えるコーナーの質問と回答をまとめた本、 「これでナットク! 植物の謎 」 という本で、次のような記述があった。

しかしメンデルにならって交雑の際に慎重に個体を選んだ三人の研究者が、それぞれ独自に出したデータも、メンデルと同様に 「きれい」なものだったので、フィッシャーの批判はあたらないとされています。

本当か?

ちなみに、Webページはこちら。 編集の都合だろうが書籍よりも記述がいくらか多い。

おそらく、「三人の研究者」というのはメンデルの法則を再発見したド・フリース、コレンス、 チェルマクの3人のことだろう。「工学のためのデータサイエンス入門」 にメンデル、コレンス、チェルマクのデータが載っているので引用する。

実験者  黄色個体  緑色個体
メンデル    6022     2001
コレンス    1394      453
チェルマク   3580      1190

ここでそれぞれのp値は0.9076, 0.6480, 0.9467である。

p値というのは、「理論が正しいとして、この比率よりも外れた比率が観測される確率」を意味する。つまり、 たとえばメンデルのデータから観測された0.9076という値は、「理論が正しい」ときに観測されたとしても問題のない範囲に存在している。

と、ぱっと見はそう思うだろう。

ただしこれを逆に考えると、「理論が正しいとして、この比率よりも『理論に適合する』 比率が観測される確率は1-pである」ということが言える。つまり、「理論」、3:1という比率、 これにメンデルの観測データはきわめて近い。そしてメンデルのデータよりもより「正確な」 データが得られる確率は1-0.9076=0.0924にすぎない。

コレンスはともかく、チェルマクのデータについてはメンデルよりも「正確」であり、 このデータが得られる確率は1-0.9467=0.0533、つまり5%程度である。

さらに悪いことに、メンデルが予想した「誤った理論」に「正確」なデータもメンデルは得てしまっている。 そこではある対立遺伝子についてF1個体の分離比をAA:Aa=201:399と報告していたのだが、 AAとAaの個体の識別方法に問題があった。メンデルは優勢形質が得られた個体からの種子10粒を育てて自家受精し、得られた種子にaa型 (劣勢)形質が見られれば親はAa型であり、全てAA型(優勢)ならば親はAA型であると判断を下した。 しかし確率的には(3/4)^10≒5%で親がAaにもかかわらず子が全てAAになってしまうという場合が生ずる。 よってメンデルの方法によって観測されるべきF1世代の遺伝子型の分離比は223:377でなければならないのである。

それに加えてなお悪いことに、メンデルは他にも数多くの形質について分離比を調査しているのである。そして、 フィッシャーの批判というのはこれらのデータ全てを総合して考察した結果にたいして向けられている。フィッシャーの計算するところによれば、 メンデルが報告した値よりも「正確な」データが得られる確率は、0.00005、 つまり10万回に5回という極めて小さな値となるというものだった(これについては「やさしい統計入門 」 から引用)。

以上から次のことが言える。

まず、メンデルのデータが当てはまりすぎているのは事実である。

つぎに、メンデルに続いた「三人の研究者」のデータが「当てはまりすぎている」かどうかというと、 これは微妙なところだ。ド・フリースのデータについては調べていないので分からないが、とりあえずチェルマクのデータはたしかに「きれい」 に当てはまっている。しかし、コレンスのデータはp=0.6480であり、これは実際の実験で「ありそうな」値だ。決して 「当てはまりすぎている」というものではない。

なので、続く研究者のデータも「きれい」なものだったからフィッシャーの批判はあてはまらない、 というようなことは言えない。

もちろん、植物が確率に従わないような何らかの制御機構を持っており、分離比が確率の示す以上に3: 1に近づくのだ、というような説は否定できない。ただ、「工学のためのデータサイエンス入門」には 「三人の研究者」 以外の研究データもいくつか載っており、 それらのp値だけを挙げると0.7408, 0.3779, 0.1742, 0.4488, 0.0950である。 理論に対して適当なずれを持っており、「きれい」というわけではない。

どうも私の調べた範囲ではフィッシャーに分があるように思えるがどうだろうか。

ちなみに、フィッシャーの意見は 「どのような結果が得られることが望ましいかを熟知している数名の研究補佐員によって、メンデルは欺かれていた可能性がある」というもので、 メンデルを直接に攻撃するものではなかったようだ。

posted by Rion778 at 04:05 | TrackBack(0) | 勉強ノート | このブログの読者になる | 更新情報をチェックする
この記事へのトラックバックURL(言及がない、関連がないと判断した場合削除することがあります)
http://blog.seesaa.jp/tb/115596731
※言及リンクのないトラックバックは受信されません。

この記事へのトラックバック
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。