2つの比率の差の検定について
―大小関係となる確率を直接求める―


問題意識

 これまで、確率に関連する検定については、いろいな尺度を工夫して、その尺度なりの論理で判断してきた。
 これは、確率を詳細に計算することには困難が多く、解析的に導かれた簡素な尺度を用いて、初めて検定が可能であったためである。
 しかし、計算機の普及・高機能化によって、多様な確率の迅速な計算が可能となり、これまでの検定方法については、再考が必要となってきているようだ。

2つの比率の差の検定方法

 具体的な事例として、例えば、「600標本のテレビ視聴率で、30%と25%に差異はあるとするかどうか。」を検討する。(ここでは、前者をケースX、後者をケースYとする。)


検定@は、図上@の点がy>xにあることで判定している。
検定A、Bは、図では明示されないが、直線y=xと1.96σの等値線が交差していることに関係している。
「一方が他方より大きい確率」は、図上y>xの範囲(黄色)の確率密度の積分値である。

@個別に区間推計を行い、その重なりの有無を検討
 比率の区間の標準偏差は、√(p*(1-p)/n)
Xは、平均値0.30、標準偏差0.0187の分布。 95%区間として26.3%〜33.7%。
Yは、平均値0.25、標準偏差0.0177の分布。 95%区間として21.5%〜28.5%。
 ここで区間に重なりがあるので、「必ずしも差があるとは言えない」と判定する。

A差がないとして、差の平均値及び標準偏差から標本の差を検討
 平均値(0)、分散(p*(1-p)*(1/nx+1/ny)) p;全体の比率、nx、ny;それぞれの標本数
 標準偏差0.0258で、95%区間では0.0506(=1.96*0.0258)となり、ぎりぎり帰無仮説が許容される。
 @と同様に、「必ずしも差があるとは言えない」と判定する。
 なお、この方法は、2標本比率の差のZ検定を変形したものであり、厳密には、離散量の場合の補正が必要である。

B2標本比率の差の区間推計により検討
 差の分散は、σ2=px*(1-px)/nx+py*(1-py)/nyであり、
 px-py±α*σが0とならないか検討する。
 ここでは、σ=0.0257となり95%区間では、0.0504(=1.96*0.0257)となり、負になる可能性がある。 結果として、「必ずしも差があるとは言えない」と判定する。

乗検定
 差があるとしてχ乗検定を利用する。
 χ値は、3.762となり、自由度1の危険率5%水準値は3.841であり、帰無仮説はぎりぎり棄却されない。
 この場合も@、A、Bと同様の結論となる。
 (解説は省略する。)

各手法の問題点
 @、A、Bについては、両側検定で考察する必要があるのかどうか異論がありえよう。(ただし、ここの事例で片側検定にすると差がない方向に変化する)。
 さらに、この95%自体が妥当か否かの議論もありえよう。例えば、9割方前者が大きいのであれば、差があるとしてもいいという感覚は否定されなければならないのか。
 また、@について、双方が重なる方向に同時に偏る確率はもっと少ないと考えられるが、この点の配慮が必要ではないか。
 他方、仮説検定の課題そのものとして、論述できる結果は、「差がある可能性が高い」あるいは「差があるとは必ずしも言えない」という水準にとどまり、その差の程度に関する情報が得にくいという難点もある。


一方が他方より大きい確率を直接計算

 以上のような検定に対して、現在では、例えば、一方が他方より大きい確率を直接求めることも容易になっている。
 具体的には、双方の確率密度の積を描いた平面で、一方が他方より大きい範囲を積分して確率を求める。この積分は解析的にでなく、区間を細分してそれぞれの確率を求め集計することが可能である。(例えば、x軸を細分し、それぞれの区分での、「xの確率密度」、「xより大きいyの確率密度の合計(累積確率密度)」、及び「x軸を細分した幅」の積を求め、合計すれば求める確率となる。この集計は、確率密度が限りなく0に近い部分を除けば、比較的狭い範囲の集計で解がでる。)
 ちなみに、上述の例で、率が逆転する確率を求めれば、2.6%程度になる。
   →Excelによる計算表

 このような結論から、この事例では、差があるとするか、必ずしもあるとは言えないとするか、境界線上の課題となっている。


結論

 上述のように一方が他方より大きい確率を直接求める発想は、極めて直感的な手法である。
 しかし、この計算は、最近のパソコン及びそのソフトウエアの性能によって初めて容易にできるようになったものである。
 これまでは、このような方法を用いることができず、解析的に導かれる尺度を利用した単純な比較でことを済ませてきたきらいがあるといえよう。
 ただし、唐突に新規な手法を使っても他者の理解を得ることが困難であり、このような手法をどう普遍化していくが課題となっている。
 今後は、各自が自らの持つ確率に対する感覚と確率の理論を重ね合わせた「実感のある考察」を各自なりに展開していくことが求められているのではなかろうか。
技法一覧に戻る

(Jun.14,2007)