日本バックギャモン協会 https://backgammon.or.jp/forum/ |
|
私の方が強い確率は? https://backgammon.or.jp/forum/viewtopic.php?f=2&t=3161 |
ページ 1 / 1 |
作成者: | kinchan [ 2012/12/01 01:11 ] |
記事の件名: | 私の方が強い確率は? |
■ 私の方が強い確率は? お世話になります。きんちゃんです。 風邪を引いて寝込みながら妄想していたことを書きます。ご笑覧下さい。:-) 互いに「おいらの方が強い」と思っているライバルが居ると思って下さい。 では、勝負!と10回戦を行いました。その結果は私から見て6勝4敗でした。 さて、私の方が真に強い確率はどれくらいなんだろうか?、多分統計学にこんなのありそうだなぁと考えたのがきっかけでした。 まず、直感ですが、仮に1億回戦行って、6000万回勝ち、4000万回負けだったとしたら、私の方が強いと断言しても問題ないと思われます。 じゃ、1万回戦の場合は?100回戦の場合は?そして、現実の10回戦の場合はどうなんでしょうか? 布団の中で iPhone を使ってぐぐった結果、ある数値の集まりが、どのような数値の範囲内にあるかを確率的に示す「信頼区間」というやつが使えそうに思えました。 一般でよく使われる「信頼区間」としては、例えば無作為に選ばれた1000人にある質問をして、500人がイエスと答えた場合、国民全体の総意は95%信頼区間が47%~53%、つまり国民の総意は95%の確率でその質問に対してイエスの人が47%~53%の間にあるという風に新聞に載ってたりします。 というわけで、試しに、10回戦、6勝4敗の場合の95%信頼区間を求めてみます。 何故こうなるかははしょって(もちろん、私も全然理解しておりません!)、次の式の値を求めます。 +- 1.96 x √(p(1-p)/n) 最初の 1.96 は95%信頼区間の場合の定数で、p は勝率、n は何回戦おこなったかです。 数値を当てはめて 1.96 x √(0.6 x 0.4 / 10 ) 大体 0.3 位、これから、私の勝率の95%信頼区間は 0.6 プラスマイナス 0.3 つまりは、勝率 30%~90% の間にあることが分かりました。 もし、100回戦行った場合は、n が 100 になり、その場合、 1.96 x √(0.6 x 0.4 / 100 ) の値は、大体、0.1 となります。つまり、私の勝率の95%信頼区間は 0.5~0.7 となります。 「おいらの方が強い」とは、私の勝率が 0.5 以上であることですから、、、どうやら、100回戦やって、60勝40敗だった場合、95%の確率で「おいらの方が強い」と言えるみたいです。 上の式の 1.96 は信頼係数と言い、95%信頼区間の値です。その他の場合の簡単な一覧を作ってみると、 99% 2.58 95% 1.96 90% 1.64 80% 1.28 70% 1.04 60% 0.84 50% 0.67 となります。 続いて、10回戦の場合に分散が 0.1 となるような信頼係数を求めてみます。 信頼係数を k とした次の式 0.1 = k x √(0.6 x 0.4 / 10) を解くと、、、、k は大体 0.67 となります。。。ってことは上の一覧からみると、50%信頼区間となり、つまりは、10回戦で6勝4敗の場合は統計学上は「どちらが強いかはなんとも言えない」となるみたいです。 ここまで読んで、「ふ~ん」と思った方がいらっしゃるかもしれませんが、上の考え方は大きな仮定があります。 例えば、10回戦で6勝4敗の場合、6勝した人の勝率は 0.6 を頂点とする正規分布と仮定しています。 9勝1敗の場合、明らかに0.9 を頂点とした正規分布になりません。でも、どうしたらよいのか分かりません。orz..... 他にも間違いがありそうですし、上の結果の信憑性は極めて怪しいものです。 というわけで、風邪引きの、朦朧とした一夜漬け統計学では、ここまでが限界と相成りました。 どなたか、引き継いでもらえませんか?:-) あるいは、考え方のヒント・アドバイスをご教示頂けると幸いです。 ではでは |
作成者: | fairytails [ 2012/12/01 02:00 ] |
記事の件名: | Re: 私の方が強い確率は? |
バックギャモンを理論的に考えている人は統計学は必要ですね。 これを理解していないとロールアウトの正確さとかの議論になりえないです からね。XGとかGnuBGをつかいこなすには基礎知識として基本は知って おきたいです。 私はオカルト系なので、こういうのはあまり知りませんが。 さて、私は95%信頼推定の考え方自体が、正しいのだけど、 あまり意 味あるものだとは思わないのです。この場合も、95%の確率で仮説が立 証された・・・となっても、負けたほうも、いや、でもまだ5%(実際は2.5% ですね)あるわけで、‘高確率で正しい‘ということを示しているにすぎない わけで、俺のほうが弱いことの証明にはならない・・・わけですからね。 ラスト6ゾロのみ振られたら負ける局面で安心できますか?と聞かれれば ギャモンプレーヤーならわかるかと。 きんちゃんが疑問に思ってる点は、きんちゃんが書いている分散は、 sample variance で、現実的には unbiased variance をつかう気が するので、やや大きい値になり(母分散の不定推定量だから)問題ない気が します。 フェスティバルでこれを聞かれたときは条件が不足していると答えたのは 。この母分散の推定量というか、分布データ的なものが必要なのでは?と私 は思ったためです。 まあ数学苦手な私が全然勘違いしている気もかなりするのですが。 理論系プレーヤーのレスを期待しましょうw 現実的には、この問題は、それなりの(当事者にとってそれなりに大きい) ステークスでやれば、どちらかがそのうちギブアップすると思いますよ。 プレ ーしている本人が一番わかることですから。私もギャモンのロングセッション で相手のほうが強いことを認めてギブアップしたことは何度もあります。 |
作成者: | ゲスト [ 2012/12/03 09:46 ] |
記事の件名: | Re: 私の方が強い確率は? |
http://www.kwansei.ac.jp/hs/z90010/suga ... ukeihy.htm 素人にも分かりやすい統計のページです。 |
作成者: | ぶーじゃむ [ 2013/02/26 22:17 ] |
記事の件名: | Re: 私の方が強い確率は? |
理論系プレイヤーじゃなくて初心者系プレイヤーですみません;; 授業で少し統計学を習ったので参考になればよいのですけど、自分も勉強中なもので間違っていたらもうしわけないです。 >>9勝1敗の場合、明らかに0.9 を頂点とした正規分布になりません。 ――ということですが、コインを投げて表か裏かという試行と同様に、今回考えるのは勝ちか敗けかの二択なので、バックギャモンの勝ち負けはベルヌーイ試行です。 ベルヌーイ試行ということは、二項分布っていうやつに従うのではないかと思います。(一定の条件下では二項分布も正規分布もほとんど同じ形なので、正規分布を使って考えてもOKな場合もあります。) 対戦成績から「自分の方が強い」ということを言うには、自分の勝利数が相手の勝利数よりも多いことが確率的に偶然じゃないっぽい と言えればよいわけなんですが、このことと、さっきの理由も合わせて二項検定というのを使えばよさそうです。 ただ、自分で計算するとすごく大変なので、簡単に求められる『js-STAR 2012』というウェブサイトを紹介します。 リンク→js-STAR 2012 左のメニューから「1×2表(正確二項検定)」を選択すると、観測値1と観測値2というのがあるので、そこに勝敗の結果をぶちこみますますとすぐ結果が得られます。 僕ときんちゃんがライバルだとすると(笑)、これまでの対戦成績は、3戦0勝3敗で、僕が3セッションとも負けているのですけど、 この場合、観測値1に「3」、観測値2に「0」を入れればOKです(逆でも可)。以下結果です。 ------------------------------------------------- 両側検定 : p=0.2500 ns (.10<p) 片側検定 : p=0.1250 ns (.10<p) ------------------------------------------------- _/_/_/ Analyzed by js-STAR _/_/_/ 僕もいまいちよく理解できているわけではないので、間違っていたらすみませんが、片側検定の結果をみれば よいはずで、P=0.1250は、中学校数学で解けるゲームで3勝0敗になる確率は 1/2×2×2=1/8=12.5% っていうのを考えれば理解が進みそうです。 「.10」というのは0.1(10%)の有意水準のことで、有意水準というのは さっきでてきた「確率的に偶然じゃないっぽさ」の水準のことです。 普通は5%(0.05)とかを使うみたいですね。(今回は10%と出ていますが。 有意水準はαで表すのですが、α>pならα水準で優位ということが言えます。 ↑の結果だと優位ではないので、偶然かもしれないということしか言えません。 僕があと1回敗けて4戦0勝4敗になれば、二項検定の結果が―― ----------------------------------------- 両側検定 : p=0.1250 ns (.10<p) 片側検定 : p=0.0625 + (.05<p<.10) ----------------------------------------- _/_/_/ Analyzed by js-STAR _/_/_/ ↑のようになるので、10%の有意水準ではきんちゃんの方が強いということが優位で、確率的に偶然とは考えにくい。といえます。 が、偶然なのに優位だと間違って判断している確率が最大で10%ということも言えます。 有意水準が10%なら最低4試合でもそんなかんじになります。 信憑性を高めるにはやっぱり母数を確保して、また有意水準を1%とかにしたほうがよいかもしれませんね。 でも試行回数増やしすぎて、無限セッションやってしまったら、相手より自分が強い確率はたぶん正確に100%か0%かのどちらかになります。 勝敗数の差が無限になりますし。 |
ページ 1 / 1 | All times are UTC+09:00 |
Powered by phpBB® Forum Software © phpBB Limited https://www.phpbb.com/ |