理論系プレイヤーじゃなくて初心者系プレイヤーですみません;;
授業で少し統計学を習ったので参考になればよいのですけど、自分も勉強中なもので間違っていたらもうしわけないです。
>>9勝1敗の場合、明らかに0.9 を頂点とした正規分布になりません。
――ということですが、コインを投げて表か裏かという試行と同様に、今回考えるのは勝ちか敗けかの二択なので、バックギャモンの勝ち負けはベルヌーイ試行です。
ベルヌーイ試行ということは、二項分布っていうやつに従うのではないかと思います。(一定の条件下では二項分布も正規分布もほとんど同じ形なので、正規分布を使って考えてもOKな場合もあります。)
対戦成績から「自分の方が強い」ということを言うには、自分の勝利数が相手の勝利数よりも多いことが確率的に偶然じゃないっぽい
と言えればよいわけなんですが、このことと、さっきの理由も合わせて二項検定というのを使えばよさそうです。
ただ、自分で計算するとすごく大変なので、簡単に求められる『js-STAR 2012』というウェブサイトを紹介します。
リンク→
js-STAR 2012
左のメニューから「1×2表(正確二項検定)」を選択すると、観測値1と観測値2というのがあるので、そこに勝敗の結果をぶちこみますますとすぐ結果が得られます。
僕ときんちゃんがライバルだとすると(笑)、これまでの対戦成績は、3戦0勝3敗で、僕が3セッションとも負けているのですけど、
この場合、観測値1に「3」、観測値2に「0」を入れればOKです(逆でも可)。以下結果です。
-------------------------------------------------
両側検定 : p=0.2500 ns (.10<p)
片側検定 : p=0.1250 ns (.10<p)
-------------------------------------------------
_/_/_/ Analyzed by js-STAR _/_/_/
僕もいまいちよく理解できているわけではないので、間違っていたらすみませんが、片側検定の結果をみれば
よいはずで、P=0.1250は、中学校数学で解けるゲームで3勝0敗になる確率は 1/2×2×2=1/8=12.5%
っていうのを考えれば理解が進みそうです。
「.10」というのは0.1(10%)の有意水準のことで、有意水準というのは
さっきでてきた「確率的に偶然じゃないっぽさ」の水準のことです。
普通は5%(0.05)とかを使うみたいですね。(今回は10%と出ていますが。
有意水準はαで表すのですが、α>pならα水準で優位ということが言えます。
↑の結果だと優位ではないので、偶然かもしれないということしか言えません。
僕があと1回敗けて4戦0勝4敗になれば、二項検定の結果が――
-----------------------------------------
両側検定 : p=0.1250 ns (.10<p)
片側検定 : p=0.0625 + (.05<p<.10)
-----------------------------------------
_/_/_/ Analyzed by js-STAR _/_/_/
↑のようになるので、10%の有意水準ではきんちゃんの方が強いということが優位で、確率的に偶然とは考えにくい。といえます。
が、偶然なのに優位だと間違って判断している確率が最大で10%ということも言えます。
有意水準が10%なら最低4試合でもそんなかんじになります。
信憑性を高めるにはやっぱり母数を確保して、また有意水準を1%とかにしたほうがよいかもしれませんね。
でも試行回数増やしすぎて、無限セッションやってしまったら、相手より自分が強い確率はたぶん正確に100%か0%かのどちらかになります。
勝敗数の差が無限になりますし。