Statistical Relevance
統計的適切性
ヘンペル流の統計的説明の扱いに関連して、テキストでも紹介した次の例を再考してみよう。
(1)連鎖球菌感染症は、ペニシリン投与でなおる確率が高い(90パーセント)。(2)太郎は連鎖球菌感染症にかかり、ペニシリン投与を受けた。--------------------------------------------------------------------(高い確率)(3)太郎の感染症はなおった。
ヘンペルのI-Sモデルでは、(3)が統計的に説明されると言えるためには、説明項と被説明項とが高い確率でつながれる必要があるだけでなく、説明項が「最大の明細性」の条件を満たしていなければならなかった。すなわち、手持ちの知識の範囲内で、ほかの情報を(1)(2)に加えても、確率が変わることはないという保証がなければならなかった。例えば、太郎が感染した連鎖球菌がペニシリン耐性のものだったとわかっておれば、適用すべき統計法則は(1)ではなく次の(a)となって、「高い確率」の条件は崩れてしまう(したがって、ヘンペルの条件を満たした「説明」ではなくなる)。
(a)ペニシリン耐性の連鎖球菌感染症は、ペニシリン投与でなおる確率が高くない(30パーセント)。(b)太郎はペニシリン耐性の連鎖球菌感染症にかかり、ペニシリン投与を受けた。--------------------------------------------------------------------(低い確率)(3)太郎の感染症はなおった。
この難点を切り抜けるために提唱された、「統計的説明」の別の分析として、サモンの「統計的適切性」のモデルがある(ただし、彼は後に因果モデルの方に移っていくのだが)。
統計的な適切性とは、次のように説明される。
まず、連鎖球菌感染症に対してペニシリンが有効か有効でないか、どのようにして判定するのだろうか。標準的な手続きは、感染者を二つの対照群(できるだけ条件を同じようにする)にわけ、一方にはペニシリン投与、他方にはペニシリン投与しない、と処置を変えて、統計的に有意な差が出るか出ないかを調べるという方法である。そして、例えば次図のような結果が得られると、ペニシリン投与が治療に有効であると見なされ、一つの統計的規則性が得られたことになる。
しかし、連鎖球菌にペニシリン耐性のものがあるとわかっておれば、対照群のこのような分割は適切ではなかったということになる。ペニシリン耐性の菌と、そうでない菌とに対しては、当然ペニシリン投与の有効性に統計的(に有意)な差が出るはずであるから、それに対応した分割の仕方を考えるべきなのである。例えば、連鎖球菌感染症と一くくりするのではなく、ペニシリン耐性とそうでないものとの二群に分け、それぞれについてペニシリン投与の有効性を調べなければならない。そして、例えば次図のような結果になったとしたなら、この二群は、統計的に適切な分割であったとわかるのである。「統計的な適切性」とは、このように、確率の差が生じるような区別にほかならない。
かくして、統計的適切性を重視するサモンの分析によれば、統計的説明のエッセンスは、問題の事実を高確率でもたらす要因を指摘することではなく、その事実に関わりのある統計的に適切な規則性を、確率の大小に関わりなくすべて数え上げることとなる。ヘンペル流の「統計的説明」が手持ちの知識に相対的になってしまうことを避けるため、サモンは、統計的な適切性を知識に相対的な「認知的」区別と、そうではない「客観的」な区別とに分類し(彼は、確率も世界の中での相対頻度という客観的な基盤をもつという見解を有する)、統計的説明が目指すべき目標は後者だ、と主張するのである。
References
Salmon, Wesley C. (1990) Four Decades of Scientific Explanation, University of Minnesota Press, 1990 [Originally in Minnesota Studies, Vol. XIII, 1989], 62-67, 77-83.
Last modified June 28, 2002. (c) Soshichi Uchii