WOO logo

隨機數撲克解決方案

規則

  1. 兩位玩家各獲得一個從 0 到 1 的均勻分佈中抽取的隨機數。
  2. 玩家 1 可以保留他的號碼,也可以換成新的隨機號碼。
  3. 玩家 2 知道玩家 1 的決定,也可以切換或保留原來的號碼。
  4. 最後的數字較大者獲勝。

問題

  1. 每個玩家的最佳策略是什麼?
  2. 假設兩個玩家都遵循最佳策略,那麼每個玩家獲勝的機率是多少?

答案

  • 玩家 1 應以小於 0.567364 的點數換牌,否則停牌。
  • 如果玩家 1 換人,那麼玩家 2 應該以小於 0.5 的點數換人,否則停牌。
  • 如果玩家 1 停牌,那麼玩家 2 應該以小於 0.660951 的點數換牌,否則停牌。
  • 玩家 1 獲勝的機率 = 0.494333。
  • 玩家 2 獲勝的機率 = 0.505667。
  • 假設每個玩家下註一個數字,那麼玩家 1 的預期值 = -0.011333。

解決方案

顯然,如果玩家 1 切換,那麼玩家 2 應該以小於 0.5 的點數切換,否則保持原樣。

否則,如果玩家 1 的初始點數大於某個特定數字,則他應該停牌。我們把這個數字設為 x。

如果玩家 1 停牌,那麼玩家 2 可以假設玩家 1 的點數不錯。玩家 2 需要積極進攻才能擊敗他。他的策略應該是,如果玩家 1 停牌,則在某個點數(我們稱為 y)以上時換牌。

要解決這類問題,你必須求解這些無差異點 x 和 y。你可以透過將站立和切換的期望值相等來實現。

對於該解決方案的其餘部分,我將從玩家 1 的角度計算預期值,假設兩個玩家各下註一個單位。

我們先來解一下 x。

預期值 = y*(2x-1) - (1-y)

命中預期值 = 0.5 * 0 + 0.25 * 0 + 0.25 * -1 = -0.25。

接下來,將這些預期值設為彼此相等:

y*(2x-1) - (1-y) = -0.25
2xy-y-1+y=-0.25
2xy-1 = -0.25
2xy = 0.75
xy = 3/8

接下來,讓我們找出如果玩家 2 擁有 y 並在玩家 1 站起來後站起來的期望值:

(yx)/(1-x)+(1-y)/(1-x)* -1 =(x-2y + 1)/(x-1)
接下來,讓我們找出如果玩家 2 持有 y 並在玩家 1 站立後擊球的預期值:

(1 /(1-x))* [(1-x)^2 * 0 + x *(1-x)* -1] =
(1 / (1-x)) * [x^2 - x] =
x * (x-1) / -(x-1) =
-x

接下來,將這些預期值設為彼此相等:

(x-2y+a) / (x-1) = -x
x^2 - 2y + 1 = 0
x^3 - 2xy + x = 0

接下來,用 3/8 代替 xy。

x^3 + x - 0.75 = 0
4x^3 + 4x - 3 = 0。

此時您可以使用三次方程式求解器得到 x = 0.567364。

已知 xy = 3/8,您可以用上面的值代入 x 得到 y = 0.660951。

然後,只需遍歷這 2 到 4 個數字的所有可能落點,即可得出每位玩家獲勝的機率。這可以用幾何或微積分來完成。請原諒我將這部分留給讀者。答案如下:

玩家 1 獲勝的機率 = 0.494333。
玩家 2 獲勝的機率 = 0.505667。
假設每個玩家下註一個數字,那麼玩家 1 的預期值 = -0.011333。

對於必須準確表達答案的人:

設 z = (3/8 + (307/1728)^(1/2))^(1/3) ~ 0.926962
那麼 x = z - 1/(3z) ~ 0.567364
則 y = 3/(8x) ~ 0.660951
則玩家 1 的預期值 = 3x/8 + y(y-1) ~ -0.011333

感謝 Joe Shipman 解決此問題。