日本バックギャモン協会

All times are UTC+09:00

私の方が強い確率は？

返信する

ユーザー名:

件名:

メッセージ本文:
メッセージを入力してください。60000 字まで入力できます。

ぶーじゃむ さんが書きました:
> 理論系プレイヤーじゃなくて初心者系プレイヤーですみません;;
> 授業で少し統計学を習ったので参考になればよいのですけど、自分も勉強中なもので間違っていたらもうしわけないです。
> 
> 
> >>９勝１敗の場合、明らかに0.9 を頂点とした正規分布になりません。
> 
> 　――ということですが、コインを投げて表か裏かという試行と同様に、今回考えるのは勝ちか敗けかの二択なので、バックギャモンの勝ち負けはベルヌーイ試行です。
> 
> ベルヌーイ試行ということは、二項分布っていうやつに従うのではないかと思います。（一定の条件下では二項分布も正規分布もほとんど同じ形なので、正規分布を使って考えてもOKな場合もあります。）
> 
> 対戦成績から「自分の方が強い」ということを言うには、自分の勝利数が相手の勝利数よりも多いことが確率的に偶然じゃないっぽい
> と言えればよいわけなんですが、このことと、さっきの理由も合わせて二項検定というのを使えばよさそうです。
> ただ、自分で計算するとすごく大変なので、簡単に求められる『js-STAR 2012』というウェブサイトを紹介します。
> 
> 　　　リンク→[url=http://www.kisnet.or.jp/nappa/software/star/freq/1x2.htm]js-STAR
> 2012[/url]
> 
> 　左のメニューから「１×２表(正確二項検定)」を選択すると、観測値１と観測値２というのがあるので、そこに勝敗の結果をぶちこみますますとすぐ結果が得られます。
> 
> 
> 僕ときんちゃんがライバルだとすると（笑）、これまでの対戦成績は、3戦0勝3敗で、僕が3セッションとも負けているのですけど、
> この場合、観測値１に「３」、観測値２に「０」を入れればOKです（逆でも可）。以下結果です。
> 
> -------------------------------------------------
> 　　　両側検定  :  p=0.2500   ns (.10<p)
> 　　　片側検定  :  p=0.1250   ns (.10<p)
> -------------------------------------------------
> _/_/_/ Analyzed by js-STAR _/_/_/
> 
> 僕もいまいちよく理解できているわけではないので、間違っていたらすみませんが、片側検定の結果をみれば
> よいはずで、P=0.1250は、中学校数学で解けるゲームで3勝0敗になる確率は　1/2×2×2＝1/8=12.5%
> っていうのを考えれば理解が進みそうです。
> 
> 「.10」というのは0.1（10%)の有意水準のことで、有意水準というのは
> さっきでてきた「確率的に偶然じゃないっぽさ」の水準のことです。
> 普通は5%(0.05)とかを使うみたいですね。（今回は10％と出ていますが。
> 有意水準はαで表すのですが、α>pならα水準で優位ということが言えます。
> ↑の結果だと優位ではないので、偶然かもしれないということしか言えません。
> 
> 僕があと1回敗けて4戦0勝4敗になれば、二項検定の結果が――
> -----------------------------------------
> 　　両側検定  :  p=0.1250   ns (.10<p)
> 　　片側検定  :  p=0.0625   +  (.05<p<.10)
> -----------------------------------------
> _/_/_/ Analyzed by js-STAR _/_/_/
> 
> ↑のようになるので、10%の有意水準ではきんちゃんの方が強いということが優位で、確率的に偶然とは考えにくい。といえます。
> が、偶然なのに優位だと間違って判断している確率が最大で10%ということも言えます。
> 
> 有意水準が10％なら最低4試合でもそんなかんじになります。
> 信憑性を高めるにはやっぱり母数を確保して、また有意水準を1%とかにしたほうがよいかもしれませんね。
> 
> 　でも試行回数増やしすぎて、無限セッションやってしまったら、相手より自分が強い確率はたぶん正確に１００%か0％かのどちらかになります。
> 勝敗数の差が無限になりますし。

オプション:

BBCode: OFF

スマイリー: OFF

URL を自動的にパースしない

クイズ

協会名の正式名称を入力してください。ヒント：ページ上部に答えがあります。（スパムボット認証）:
答えを正確に入力してください。答えられるかどうかでスパムボットか否かを判定します。

トピックのレビュー - 私の方が強い確率は？

作成者

メッセージ

ぶーじゃむ

記事の件名:

Re: 私の方が強い確率は？

引用付きで返信する

理論系プレイヤーじゃなくて初心者系プレイヤーですみません;;
授業で少し統計学を習ったので参考になればよいのですけど、自分も勉強中なもので間違っていたらもうしわけないです。

>>９勝１敗の場合、明らかに0.9 を頂点とした正規分布になりません。

　――ということですが、コインを投げて表か裏かという試行と同様に、今回考えるのは勝ちか敗けかの二択なので、バックギャモンの勝ち負けはベルヌーイ試行です。
ベルヌーイ試行ということは、二項分布っていうやつに従うのではないかと思います。（一定の条件下では二項分布も正規分布もほとんど同じ形なので、正規分布を使って考えてもOKな場合もあります。）

対戦成績から「自分の方が強い」ということを言うには、自分の勝利数が相手の勝利数よりも多いことが確率的に偶然じゃないっぽい
と言えればよいわけなんですが、このことと、さっきの理由も合わせて二項検定というのを使えばよさそうです。
ただ、自分で計算するとすごく大変なので、簡単に求められる『js-STAR 2012』というウェブサイトを紹介します。

　　　リンク→js-STAR 2012

　左のメニューから「１×２表(正確二項検定)」を選択すると、観測値１と観測値２というのがあるので、そこに勝敗の結果をぶちこみますますとすぐ結果が得られます。

僕ときんちゃんがライバルだとすると（笑）、これまでの対戦成績は、3戦0勝3敗で、僕が3セッションとも負けているのですけど、
この場合、観測値１に「３」、観測値２に「０」を入れればOKです（逆でも可）。以下結果です。

-------------------------------------------------
　　　両側検定 : p=0.2500 ns (.10<p)
　　　片側検定 : p=0.1250 ns (.10<p)
-------------------------------------------------
_/_/_/ Analyzed by js-STAR _/_/_/

僕もいまいちよく理解できているわけではないので、間違っていたらすみませんが、片側検定の結果をみれば
よいはずで、P=0.1250は、中学校数学で解けるゲームで3勝0敗になる確率は　1/2×2×2＝1/8=12.5%
っていうのを考えれば理解が進みそうです。

「.10」というのは0.1（10%)の有意水準のことで、有意水準というのは
さっきでてきた「確率的に偶然じゃないっぽさ」の水準のことです。
普通は5%(0.05)とかを使うみたいですね。（今回は10％と出ていますが。
有意水準はαで表すのですが、α>pならα水準で優位ということが言えます。
↑の結果だと優位ではないので、偶然かもしれないということしか言えません。

僕があと1回敗けて4戦0勝4敗になれば、二項検定の結果が――
-----------------------------------------
　　両側検定 : p=0.1250 ns (.10<p)
　　片側検定 : p=0.0625 + (.05<p<.10)
-----------------------------------------
_/_/_/ Analyzed by js-STAR _/_/_/

↑のようになるので、10%の有意水準ではきんちゃんの方が強いということが優位で、確率的に偶然とは考えにくい。といえます。
が、偶然なのに優位だと間違って判断している確率が最大で10%ということも言えます。

有意水準が10％なら最低4試合でもそんなかんじになります。
信憑性を高めるにはやっぱり母数を確保して、また有意水準を1%とかにしたほうがよいかもしれませんね。

　でも試行回数増やしすぎて、無限セッションやってしまったら、相手より自分が強い確率はたぶん正確に１００%か0％かのどちらかになります。
勝敗数の差が無限になりますし。

投稿記事

Posted: 2013/02/26 22:17

ゲスト

記事の件名:

Re: 私の方が強い確率は？

引用付きで返信する

http://www.kwansei.ac.jp/hs/z90010/suga ... ukeihy.htm

素人にも分かりやすい統計のページです。

投稿記事

Posted: 2012/12/03 09:46

fairytails

記事の件名:

Re: 私の方が強い確率は？

引用付きで返信する

　バックギャモンを理論的に考えている人は統計学は必要ですね。
これを理解していないとロールアウトの正確さとかの議論になりえないです
からね。XGとかGnuBGをつかいこなすには基礎知識として基本は知って
おきたいです。
　私はオカルト系なので、こういうのはあまり知りませんが。

　さて、私は９５％信頼推定の考え方自体が、正しいのだけど、　あまり意
味あるものだとは思わないのです。この場合も、９５％の確率で仮説が立
証された・・・となっても、負けたほうも、いや、でもまだ５％（実際は２．５％
ですね）あるわけで、‘高確率で正しい‘ということを示しているにすぎない
わけで、俺のほうが弱いことの証明にはならない・・・わけですからね。
　ラスト６ゾロのみ振られたら負ける局面で安心できますか？と聞かれれば
ギャモンプレーヤーならわかるかと。
　
　きんちゃんが疑問に思ってる点は、きんちゃんが書いている分散は、
sample variance　で、現実的には　unbiased variance をつかう気が
するので、やや大きい値になり（母分散の不定推定量だから）問題ない気が
します。
　フェスティバルでこれを聞かれたときは条件が不足していると答えたのは
。この母分散の推定量というか、分布データ的なものが必要なのでは？と私
は思ったためです。
　まあ数学苦手な私が全然勘違いしている気もかなりするのですが。

　理論系プレーヤーのレスを期待しましょうｗ

　現実的には、この問題は、それなりの（当事者にとってそれなりに大きい）
ステークスでやれば、どちらかがそのうちギブアップすると思いますよ。　プレ
ーしている本人が一番わかることですから。私もギャモンのロングセッション
で相手のほうが強いことを認めてギブアップしたことは何度もあります。

投稿記事

Posted: 2012/12/01 02:00

kinchan

記事の件名:

私の方が強い確率は？

引用付きで返信する

■　私の方が強い確率は？

お世話になります。きんちゃんです。
風邪を引いて寝込みながら妄想していたことを書きます。ご笑覧下さい。:-)

互いに「おいらの方が強い」と思っているライバルが居ると思って下さい。
では、勝負！と１０回戦を行いました。その結果は私から見て６勝４敗でした。
さて、私の方が真に強い確率はどれくらいなんだろうか？、多分統計学にこんなのありそうだなぁと考えたのがきっかけでした。

まず、直感ですが、仮に１億回戦行って、６０００万回勝ち、４０００万回負けだったとしたら、私の方が強いと断言しても問題ないと思われます。
じゃ、１万回戦の場合は？１００回戦の場合は？そして、現実の１０回戦の場合はどうなんでしょうか？

布団の中で iPhone を使ってぐぐった結果、ある数値の集まりが、どのような数値の範囲内にあるかを確率的に示す「信頼区間」というやつが使えそうに思えました。
一般でよく使われる「信頼区間」としては、例えば無作為に選ばれた１０００人にある質問をして、５００人がイエスと答えた場合、国民全体の総意は９５％信頼区間が４７％～５３％、つまり国民の総意は９５％の確率でその質問に対してイエスの人が４７％～５３％の間にあるという風に新聞に載ってたりします。

というわけで、試しに、１０回戦、６勝４敗の場合の９５％信頼区間を求めてみます。
何故こうなるかははしょって（もちろん、私も全然理解しておりません！）、次の式の値を求めます。

＋－　1.96 x √(p(1-p)/n)

最初の 1.96 は９５％信頼区間の場合の定数で、p は勝率、n は何回戦おこなったかです。

数値を当てはめて

1.96 x √(0.6 x 0.4 / 10 )

大体 0.3 位、これから、私の勝率の９５％信頼区間は 0.6 プラスマイナス 0.3 つまりは、勝率３０％～９０％の間にあることが分かりました。
もし、１００回戦行った場合は、n が 100 になり、その場合、

1.96 x √(0.6 x 0.4 / 100 )

の値は、大体、0.1 となります。つまり、私の勝率の９５％信頼区間は 0.5～0.7 となります。
「おいらの方が強い」とは、私の勝率が 0.5 以上であることですから、、、どうやら、１００回戦やって、６０勝４０敗だった場合、９５％の確率で「おいらの方が強い」と言えるみたいです。

上の式の 1.96 は信頼係数と言い、９５％信頼区間の値です。その他の場合の簡単な一覧を作ってみると、

99% 2.58
95% 1.96
90% 1.64
80% 1.28
70% 1.04
60% 0.84
50% 0.67

となります。

続いて、１０回戦の場合に分散が 0.1 となるような信頼係数を求めてみます。
信頼係数を k とした次の式

0.1 = k x √(0.6 x 0.4 / 10)

を解くと、、、、k は大体 0.67 となります。。。ってことは上の一覧からみると、５０％信頼区間となり、つまりは、１０回戦で６勝４敗の場合は統計学上は「どちらが強いかはなんとも言えない」となるみたいです。

ここまで読んで、「ふ～ん」と思った方がいらっしゃるかもしれませんが、上の考え方は大きな仮定があります。
例えば、１０回戦で６勝４敗の場合、６勝した人の勝率は 0.6 を頂点とする正規分布と仮定しています。
９勝１敗の場合、明らかに0.9 を頂点とした正規分布になりません。でも、どうしたらよいのか分かりません。orz.....
他にも間違いがありそうですし、上の結果の信憑性は極めて怪しいものです。

というわけで、風邪引きの、朦朧とした一夜漬け統計学では、ここまでが限界と相成りました。
どなたか、引き継いでもらえませんか？:-)
あるいは、考え方のヒント・アドバイスをご教示頂けると幸いです。

ではでは

投稿記事

Posted: 2012/12/01 01:11

掲示板トップ » »

All times are UTC+09:00