量化面试绿皮书：35. 蒙蒂霍尔问题

文中内容仅限技术学习与代码实践参考，市场存在不确定性，技术分析需谨慎验证，不构成任何投资建议。

35. 蒙蒂霍尔问题

蒙提·霍尔问题是一个基于美国老电视节目《让我们做个交易》的概率谜题，该问题以该节目的主持人命名。假设你现在在节目现场，有三扇门供你选择。其中一扇门后面是一辆汽车，另外两扇门后面是山羊。你事先不知道每扇门后面是什么。
你挑选了一扇门并宣布你的选择。就在你挑选了这扇门之后，蒙提会打开另外两扇门中的一扇，他知道这扇门后面是山羊。然后他给你一个选择，要么坚持你最初的选择，要么换成第三扇门。

Q: 你该不该换呢？如果你换的话，赢得汽车的概率是多少呢？

A: 是的，你应该换门！换门后赢得汽车的概率是 $\dfrac{2}{3}$ （约 66.7%）。相反，如果坚持最初的选择，赢得汽车的概率只有 $\dfrac{1}{3}$ （约 33.3%）。下面我来一步步解释原因，这样更容易理解。

问题背景回顾

有三扇门：一扇门后面是汽车，另外两扇门后面是山羊。
你随机选择一扇门（假设你选了门 1）。
主持人蒙提·霍尔（他知道每扇门后面是什么）会打开另一扇门，露出山羊（例如，他打开了门 3，后面是山羊）。
然后，蒙提给你机会：坚持选择门 1，或者换成剩下的门（门 2）。

为什么应该换门？概率分析

很多人直觉上认为，此时只剩两扇门（你的门 1 和未开的门 2），每扇门有 50% 的概率有汽车，所以换不换无所谓。但这是错误的，因为蒙提的行动不是随机的——他故意打开一扇山羊门，这提供了额外信息，改变了概率分布。

正确的分析基于你最初选择的概率：

当你最初选择一扇门时：
- 你选到汽车的概率是 1/3（因为只有一扇门有汽车）。
- 你选到山羊的概率是 2/3（因为有两扇门是山羊）。
蒙提的行动：
- 如果你最初选到了汽车（概率 1/3），蒙提会打开一扇山羊门（他有两个选择，但无论打开哪一扇，剩下的那扇门都是山羊）。如果你换门，你会输（因为换到山羊）。
- 如果你最初选到了山羊（概率 2/3），蒙提只能打开另一扇山羊门（因为他不能打开你的门或汽车门），所以剩下的那扇门一定是汽车。如果你换门，你会赢。
换门的结果：
- 换门后赢得汽车的概率 = 你最初选到山羊的概率 = 2/3。
- 换门后输的概率 = 你最初选到汽车的概率 = 1/3。
不换门的结果：
- 坚持原选择赢得汽车的概率 = 你最初选到汽车的概率 = 1/3。
- 坚持原选择输的概率 = 你最初选到山羊的概率 = 2/3。

简单总结

换门策略将你的赢面从 1/3 提高到 2/3，因为蒙提的干预实际上“转移”了概率：初始选择时，你有更高概率（2/3）选错（山羊），而换门正好利用了这一点，把错误选择转化为正确选择。
不换门的话，你只能依赖初始的 1/3 概率，这很低。

为什么不是 50-50？

因为蒙提不是随机开门——他总是打开一扇山羊门，这相当于帮你排除了一个错误选项。但你的初始选择是随机的，所以概率“权重”并不平均：初始选错的概率（2/3）通过换门可以变成赢的机会。

实际验证

这个问题可以用模拟或枚举法验证：

假设汽车在门 1（其他情况类似）：
- 你选门 1（概率 1/3）：蒙提开门 2 或 3（山羊），如果你换门，你输。
- 你选门 2（概率 1/3）：蒙提必须开门 3（山羊），如果你换到门 1，你赢。
- 你选门 3（概率 1/3）：蒙提必须开门 2（山羊），如果你换到门 1，你赢。
换门赢的情况有 2 种（当你初始选错时），总赢概率 2/3。

Python 实现

以下是使用Python实现蒙提·霍尔问题模拟的代码，遵循Google强类型风格和注释规范：

import random
from typing import Tupledef simulate_monty_hall(num_simulations: int) -> Tuple[float, float]:"""模拟蒙提·霍尔问题并计算获胜概率。Args:num_simulations (int): 模拟次数Returns:Tuple[float, float]: 包含两个概率的元组: (不换门的获胜概率, 换门的获胜概率)"""# 初始化获胜计数器stay_wins = 0switch_wins = 0for _ in range(num_simulations):# 随机放置汽车 (0: 山羊, 1: 汽车)doors = [0, 0, 0]car_index = random.randint(0, 2)doors[car_index] = 1# 参赛者随机选择一扇门initial_choice = random.randint(0, 2)# 主持人打开一扇有山羊的门 (不能是参赛者选择的门)host_options = [i for i in range(3) if i != initial_choice and doors[i] == 0]host_opens = random.choice(host_options)# 计算换门选择: 既不是初始选择也不是主持人打开的门switch_choice = next(i for i in range(3) if i != initial_choice and i != host_opens)# 统计两种策略的结果if doors[initial_choice] == 1:stay_wins += 1if doors[switch_choice] == 1:switch_wins += 1# 计算概率stay_prob = stay_wins / num_simulationsswitch_prob = switch_wins / num_simulationsreturn stay_prob, switch_prob# 配置模拟参数
NUM_SIMULATIONS = 100000# 运行模拟
stay_prob, switch_prob = simulate_monty_hall(NUM_SIMULATIONS)# 打印结果
print(f"模拟次数: {NUM_SIMULATIONS}")
print(f"不换门获胜概率: {stay_prob:.4f} (理论值: 0.3333)")
print(f"换门获胜概率: {switch_prob:.4f} (理论值: 0.6667)")
print(f"换门的优势比: {switch_prob/stay_prob:.2f}:1")

代码说明

随机放置汽车位置
参赛者随机选择初始门
主持人打开一扇有山羊的门（不能是参赛者选择的门）
计算换门策略的选择
统计两种策略的获胜次数

输出：

模拟次数: 100000
不换门获胜概率: 0.3330 (理论值: 0.3333)
换门获胜概率: 0.6670 (理论值: 0.6667)
换门的优势比: 2.00:1

关键结论

换门策略的获胜概率接近理论值2/3 (66.67%)
不换门策略的获胜概率接近理论值1/3 (33.33%)
换门策略的获胜概率是不换门策略的两倍

此模拟验证了蒙提·霍尔问题的反直觉结论：尽管表面上看起来是二选一，但由于主持人提供的信息改变了概率分布，换门策略能显著提高获胜概率。

这道面试题的本质是考察候选人对概率论本质的理解深度、条件概率的建模能力以及在信息不对称环境下进行最优决策的思维，这些能力直接对应量化交易策略开发、风险管理模型构建和衍生品定价中的核心挑战。

🔑 核心知识点

条件概率与贝叶斯推理
- 必须掌握 $\frac{P(B|A)P(A)}{P(B)}$ 的实质应用
- 理解主持人行为带来的信息价值（已知山羊位置改变概率分布）
期望值决策理论
- 量化不同策略的期望收益：换门策略 $\frac{2}{3}$ vs 坚持策略 $\frac{1}{3}$
- 识别表面50/50背后的真实概率分布
蒙特卡洛方法迁移
- 通过模拟验证理论结果（本题Python实现）
- 将相同方法论应用于金融场景（如期权定价、风险价值计算）
信息经济学思维
- 主持人行为本质是信息释放过程
- 类比市场信号对资产价格的影响机制

📊 面试评估维度

考察维度	具体表现要求	本题对应点
概率建模能力	将现实问题转化为概率模型	用条件概率描述主持人行为对初始选择的影响
决策优化能力	在动态信息流中寻找最优解	比较换门/坚持策略的期望收益
数值验证能力	通过编程验证理论结果	Python模拟中实现概率收敛到理论值
反直觉洞察	突破表面认知发现本质规律	解释为何50/50的直觉错误，揭示信息价值
金融场景迁移	将数学原理映射到金融实践	类比市场新信息如何改变资产价格概率分布

🧩 典型回答框架

明确规则约束
- 主持人必开山羊门且知悉所有门后内容
- 开门行为非随机（信息释放的关键）
构建概率模型
- 初始选择正确概率： $P(\text{正确}) = \frac{1}{3}$
- 换门获胜条件：初始选择错误（概率 $\frac{2}{3}$ ）
- 条件概率公式： $P(\text{换赢}) = P(\text{初始错}) \times 1$
贝叶斯推理验证
$\begin{align*} P(\text{车在B}|\text{开C}) &= \frac{P(\text{开C}|\text{车在B})P(\text{车在B})}{P(\text{开C})} \\ &= \frac{1 \times \frac{1}{3}}{\frac{1}{2}} = \frac{2}{3} \end{align*}$
决策树分析
结论
换门策略将获胜概率从 $\frac{1}{3}$ 提升至 $\frac{2}{3}$ ，期望收益翻倍