第6章: 市场结构与博弈论

第5章推导了竞争性企业的供给曲线：在 $P = MC$ 处生产。但这一结果假设企业是价格接受者——相对于市场而言太小，无法影响价格。许多现实市场违反了这一假设。单一卖方（垄断者）自行定价。少数大型企业（寡头垄断者）必须考虑竞争对手的反应。本章描绘市场结构的谱系，并引入博弈论作为战略互动的语言。

前置知识：第5章（成本曲线、利润最大化、拉格朗日乘数法）。

6.1 完全竞争：长期均衡

在第5章中，我们证明了竞争性企业在 $P = MC$ 处实现利润最大化。在长期中，自由进入和退出导致进一步的结果。

经济利润为零并不意味着企业遭受损失。这意味着它们获得了正常回报——恰好覆盖所有成本，包括资本的机会成本。会计利润仍然为正。

直觉模式

这说明了什么： Zero economic profit is a normal return, not a loss. The owner earns exactly what their money and effort could have earned in their next-best use -- the opportunity cost of staying in business.

为什么这很重要： "Zero profit" sounds like going broke; it actually means "no better deal available anywhere." Free entry and exit is the engine: as long as a firm earns more than its owner could earn elsewhere, that gap is a signal that pulls competitors in.

什么发生变化： If a corner bakery earns real money beyond what its owner could make doing the next-best thing, someone opens a competitor down the street. Entry keeps going until the extra profit is competed away -- which is exactly the long-run equilibrium $P = MC = AC_{min}$.

In Full Mode, Eq. 6.1 states the zero-profit condition formally.

The cost curves behind $AC_{min}$ — and why free entry pushes price down to the bottom of the average-cost curve — are built in Chapter 5, §5.6 (Cost Curves).

This "competition is a state of rest" picture is itself contested. For the rival view — that competition is a process of discovery rather than an end-state — see the Austrian tradition (History of Economic Thought, Ch. 6) and Hayek's "The Meaning of Competition."

6.2 垄断

直觉模式

这说明了什么： 垄断者通过平衡两种力量来决定生产多少：生产更多意味着额外销售带来更多收入，但也意味着必须降低每一单位的价格。利润是总收入减去总成本，垄断者选择利润差额最大的产量。

为什么这很重要： 与简单地接受市场价格并决定产量的竞争性企业不同，垄断者通过产量决策来控制价格。这一单一差异——企业面对整条需求曲线而非水平价格线——产生了所有垄断理论：产量受限、价格更高以及无谓损失。

什么发生变化： 如果成本上升，垄断者产量减少，价格提高。如果需求向外移动（消费者增加、支付意愿提高），垄断者产量增加，但价格也提高——将很大一部分增量以利润形式收入囊中，而非以更低价格回馈消费者。

在完整模式下，方程6.2陈述了形式化的最优化问题。

边际收益

边际收益。 销售额外一个单位所带来的额外收入。对于价格接受者企业，$MR = P$。对于具有市场力量的企业，$MR < P$，因为增加产出需要降低所有已售单位的价格。

$$MR = \frac{dTR}{dQ} = P + Q\frac{dP}{dQ}$$ (Eq. 6.3)

边际收益由两部分构成：

$P$：以当前价格多卖一单位所获得的收入（产量效应）
$Q \cdot dP/dQ$：由于价格必须在所有单位上下降而损失的收入，不仅仅是边际单位（价格效应）

产量效应与价格效应。 产出效应是以当前价格销售额外一个单位所获得的收益。价格效应是因降低所有内部边际单位价格而造成的损失。边际收入是这两种力量的净值：$MR = \underbrace{P}_{\text{产出效应}} + \underbrace{Q \cdot dP/dQ}_{\text{价格效应}}$。

对于向下倾斜的需求曲线，$dP/dQ < 0$，所以 $MR < P$。对于线性需求 $P = a - bQ$：$TR = aQ - bQ^2$，所以 $MR = a - 2bQ$。MR曲线与需求曲线有相同的截距但斜率是两倍。

边际收益与弹性的关系

$$MR = P\left(1 - \frac{1}{|\varepsilon_d|}\right)$$

垄断者永远不会在 $MR < 0$ 处生产（因为减少产量反而能增加收入），因此垄断者只在需求的弹性区间运营，即 $|\arepsilon_d| > 1$。

利润最大化条件：

$$MR = MC$$ (Eq. 6.4)

直觉模式

这说明了什么： 边际收入是多销售一单位所带来的额外收入。对于面对向下倾斜需求曲线的垄断者而言，MR始终低于价格，因为为了多销售一单位而降价会减少所有现有单位的收入。

为什么这很重要： 价格与MR之间的差距正是垄断者限制产量的原因——他们在竞争性产量之前就停止生产，因为每增加一单位都会侵蚀之前销售的收入。企业通过将产量维持在MR恰好等于MC的水平来最大化利润。

什么发生变化： 当需求弹性增大（消费者对价格更敏感）时，MR更接近价格，垄断者的行为更像竞争性企业。当需求缺乏弹性时，MR实际上是负值——垄断者绝不会在需求缺乏弹性的区间内生产。

在完整模式下，方程6.3–6.4从收入函数推导边际收入，并展示利润最大化条件。

直觉模式

这说明了什么： 价格弹性越大（消费者有更多替代品），勒纳指数越小，垄断者的加成越小——价格趋近于边际成本。当需求极度缺乏弹性时（几乎没有替代品），垄断者可以收取更高的加成。这就是为什么拥有专利药品的制药公司定价远高于成本，而面临卫星竞争的地方有线电视公司则不能。

为什么这很重要： 这就是垄断者限制产量、抬高价格的原因——不是出于恶意，而是因为面对向下倾斜需求曲线的数学逻辑使以更高价格少卖变得有利可图。无谓损失来自那些消费者估价高于生产成本的单位，但垄断者选择不出售，因为出售这些单位需要对所有其他单位降价。

什么发生变化： 当需求弹性增大（消费者拥有更多替代品）时，勒纳指数下降，垄断者的加成收窄——价格趋近于边际成本。当需求极度缺乏弹性（几乎没有替代品）时，垄断者可以收取更高的加成。这就是为什么拥有专利药品的制药公司定价远高于成本，而面临卫星竞争的地方有线电视公司则不能。

在完整模式下，方程6.5从MR = MC条件推导勒纳指数。

边际成本之上的加价等于需求价格弹性（绝对值）的倒数。需求弹性越大意味着市场力量越小。

The Lerner index is economics's main way of measuring power: it turns "this firm has clout" into a number. How that compares to how other disciplines define power is the subject of a separate walkthrough, How do different disciplines understand power?

例 6.1 —— 垄断定价

需求：$P = 100 - 2Q$。成本：$TC = 20Q$（常数 $MC = 20$）。

$TR = 100Q - 2Q^2$，$MR = 100 - 4Q$。

\$MR = MC\$：\\$100 - 4Q = 20 \implies Q_M = 20\$，\$P_M = 60\$。

$\Pi = (60 - 20)(20) = 800$。

竞争结果：$P = MC = 20$，$Q_C = 40$。

$DWL = \frac{1}{2}(60 - 20)(40 - 20) = 400$。

勒纳指数：$(60 - 20)/60 = 2/3$。验证：$\varepsilon_d = (dQ/dP)(P/Q) = (-1/2)(60/20) = -1.5$，所以 $1/|\varepsilon_d| = 2/3$。✓

观点

"Amazon is a monopoly even though prices are low" — Lina Khan, Yale Law Journal, 2017

Lina Khan was a 28-year-old law student when she published "Amazon's Antitrust Paradox." The article was so influential it got her appointed chair of the FTC. Her claim: the consumer welfare standard that has governed antitrust since the 1980s is blind to Amazon's power because it only looks at prices. Amazon keeps prices low, so the standard says there's no problem. Khan says the standard is broken. By the Lerner index you just learned, she's making a radical claim: market power can exist even when $(P - MC)/P$ is near zero.

中级

流行版本

可汗的文章催生了一场运动——"新布兰代斯"反垄断——以及一个比她的实际论证更薄弱的流行版本。流行的反科技论调："它们是垄断——把它们拆了！"这是在按市场份额做模式匹配（份额高=垄断=坏），而不直面机制：消费者如何被伤害？§6.2中的教科书垄断通过更高价格和更低产量伤害消费者，但谷歌不向消费者收费，亚马逊的价格往往是可得的最低价。不指明消费者伤害却说"拆了它们"，等于靠单一症状诊断疾病。流行的亲科技反击同样薄弱："如果它们是垄断，价格就会很高——谷歌是免费的！"这把零价当作没有市场势力的证明，却忽视了"免费"服务是用数据和注意力支付的、谷歌的垄断势力运作于广告市场（那里它非常有效地定价），而且消费者福利包含价格之外的维度——隐私、选择、创新。可汗的实际论点比任何一方都更精细。但流行版本主导着辩论。

最强支持论点

当你把可汗的框架推到其分析极限时是这样的。第一，相邻市场中的市场势力。亚马逊市集可能给消费者低价，但亚马逊通过费用、广告和物流要求向卖家收取30-50%的收入——卖家无法离开，因为客户在那里。谷歌搜索对用户免费，但谷歌广告对广告主不免费——谷歌在广告上持续保持50%以上的营业利润率，暗示了显著的市场势力。在面向卖家或广告主的市场上计算的勒纳指数远不为零。第二，网络效应创造持久的壁垒，减少未来的竞争。平台垄断可能降低动态效率——原本会在竞争中发生的创新未能发生，因为进入者无法克服在位者的数据和网络优势。这是可汗最深刻的洞见：伤害的不是今天的消费者，而是明天的竞争者。第三，掠夺性定价循环。亚马逊可以凭借AWS的利润在新市场（尿布、图书、日杂）维持低于成本的定价，把竞争对手赶出去，然后在主导之后提高收费。传统反垄断因为消费者价格仍然低而给它开脱。可汗说，这恰恰是盲点。

最强反对论点

对可汗框架的三项有力反驳。第一，消费者福利确实巨大。Brynjolfsson等人（2019）估计搜索引擎给消费者带来的中位剩余为每年 \$17,500。这些不是被剥削的消费者。拆分平台很可能减少这一剩余——碎片化的社交网络不如统一的有用，亚马逊的物流网络带来真实的成本节约。传统垄断框架的存在是为了保护消费者，而按消费者结果衡量，大科技正在交付。第二，市场主导地位是可争夺的。IBM主导大型机，后来输给微软；微软主导PC，后来在搜索上输给谷歌；MySpace输给脸书；TikTok对Instagram爆炸式崛起。如果进入壁垒如可汗所说的那样持久，这些颠覆就不应发生——但它们不断发生。第三，可汗的框架没有限定原则。如果低价可以与垄断势力共存，且未来的伤害即使在当前无伤害时也计入，那几乎任何大公司都可以被贴上垄断者的标签。一个能给任何人定罪的反垄断标准等于不给任何人定罪——它会变成披着竞争法外衣的产业政策。

判断

可汗说消费者福利标准对平台垄断视而不见——她对吗？是的——这是她的持久贡献。§6.2中的无谓损失框架——垄断者压低产量并把价格抬到边际成本之上——无法干净地套到定价为零、产出数字无限、制造巨大消费者剩余的平台之上。勒纳指数 $(P - MC)/P$ 对免费产品字面上返回零。这反映的是框架局限性。这些企业并非具有竞争性；而是指标失灵了。但可汗提出的替代方案仍未充分发展。真正的垄断担忧在教科书低估的三个领域：(1) 相邻市场中的市场势力（广告、卖家费、应用分发），这些企业在那里确实收费并攫取租金；(2) 动态竞争的削减——不是对今天消费者的伤害，而是更好产品明天被建造出来的概率下降；(3) 在极度信息不对称下的数据提取。欧盟的《数字市场法》朝着可汗的方向移动，基于结构地位而非消费者价格来监管"守门人"平台。这是否有效仍是悬而未决的问题。可汗诊断出了反垄断框架中的真实疾病。药方仍在书写之中。

There is a second way to read monopoly profit: not only as a welfare loss but as the prize that funds innovation. That Schumpeterian reading — temporary monopoly as the engine of "creative destruction" — is formalized in Chapter 13, §13.4 (Endogenous Growth), and its intellectual lineage runs through Schumpeter himself (History of Economic Thought, Ch. 7 — forthcoming).

6.3 价格歧视

一级（完全）价格歧视

企业对每个消费者收取其最高支付意愿。这提取了全部消费者剩余。产量是有效的（$Q = Q_C$）——没有无谓损失——但所有剩余归企业所有。

二级价格歧视

企业提供不同的定价方案（数量折扣、捆绑销售、版本定价）让消费者自行选择。例如：机票（商务舱与经济舱）、软件（基础版与专业版）、批量定价。

三级价格歧视

企业识别具有不同弹性的群体，对每个群体收取不同的价格：

直觉模式

这说明了什么： 实施价格歧视的企业在所有市场中将边际收入设定相等，并等于边际成本。这意味着企业对价格不敏感的顾客（需求弹性较小的顾客）收取更高价格，对价格更敏感的顾客收取更低价格。

为什么这很重要： 这是学生折扣、老年人优惠价、区域定价和峰值定价背后的逻辑。企业不是在怜悯学生——而是通过对支付意愿不同的群体收取不同价格来获取更多总收入。航空公司将这一点做到极致：商务旅客支付更多，因为他们的灵活性更低。

什么发生变化： 如果市场间弹性差距缩小（两组消费者对价格同样敏感），最优价格趋于一致，价格歧视变得无利可图。如果套利成为可能（学生将折扣票转售给成人），价格歧视就会崩溃为单一价格。

在完整模式下，MR-弹性关系式精确地展示了价格比如何取决于需求弹性。

例 6.2 —— 三级价格歧视

一家剧院面对两个市场。成人需求：$P_A = 20 - Q_A$。学生需求：$P_S = 12 - Q_S$。$MC = 2$。

成人：$MR_A = 20 - 2Q_A = 2 \implies Q_A = 9$，$P_A = 11$。

学生：$MR_S = 12 - 2Q_S = 2 \implies Q_S = 5$，$P_S = 7$。

总利润：$(11-2)(9) + (7-2)(5) = 81 + 25 = 106$。

6.4 垄断竞争

短期：企业可能获得正利润或负利润。长期：进入和退出驱动经济利润归零。

在长期均衡中，每家企业在其需求曲线与平均成本曲线相切处生产。切线条件同时施加两个要求：

$$P = AC \quad \text{(zero profit)} \quad \text{and} \quad MR = MC \quad \text{(profit maximization)}$$ (Eq. 6.8)

由于企业面临向下倾斜的需求曲线，切点出现在平均成本最低点的左侧——企业在低于有效规模的水平上生产。

直觉模式

这说明了什么： 从长期来看，垄断竞争产生一种独特的结果：企业获得零经济利润（自由进入竞争掉了利润），但仍然收取高于边际成本的价格（产品差异化使每家企业在其特定品种上拥有小型垄断地位）。企业的经营规模低于平均成本最小化的规模。

为什么这很重要： 这是"多样性的代价"。拥有50家不同餐厅而非50家相同食堂，意味着每家餐厅服务的顾客更少，经营规模低于最有效率的水平。这是否真的低效，取决于消费者对差异化本身的重视程度。

什么发生变化： 如果产品变得更不差异化（替代性更强），每家企业的需求曲线变得更有弹性，加成收窄，结果趋近于完全竞争。如果进入壁垒提高，企业在长期内能维持正的利润——结果趋近于垄断。

在完整模式下，方程6.8展示了确定长期均衡的切线条件。

这些是否真的低效是有争议的。Dixit-Stiglitz框架表明消费者重视多样性——拥有50家不同的餐厅比50家相同的餐厅更有价值，即使相同的餐厅更便宜。边际成本之上的加价是"多样性的价格"。

6.5 寡头垄断：古诺竞争

古诺模型

企业同时选择产量。每家企业的最优产量取决于其他企业的产量。

两家企业，需求 $P = a - b(q_1 + q_2)$，两家的边际成本均为常数 $c$。

This is not a timeless picture of "how firms compete" — it is one school's formalization, born in 1838 when Cournot wrote down the first reaction-function model. Its lineage runs through Walras, Marshall, and Joan Robinson. See the Marginalist revolution (History of Economic Thought, Ch. 5) for where this apparatus came from, or the intellectual-genealogy timeline to place Cournot among his contemporaries.

Firm 1 maximizes $\Pi_1 = [a - b(q_1 + q_2) - c] \cdot q_1$. Taking the first-order condition:

$$\frac{\partial \Pi_1}{\partial q_1} = a - 2bq_1 - bq_2 - c = 0$$ (Eq. 6.7a)

对 $q_1$ 求解得到最优反应函数：

$$q_1^*(q_2) = \frac{a - c}{2b} - \frac{q_2}{2}$$ (Eq. 6.7)

古诺-纳什均衡（联立求解）：

$$q_1^C = q_2^C = \frac{a - c}{3b}$$ (Eq. 6.9)

$$Q^C = \frac{2(a-c)}{3b}, \quad P^C = \frac{a + 2c}{3}$$ (Eq. 6.10)

直觉模式

这说明了什么： 每家企业通过问："给定竞争对手的产量，什么产量能最大化我的利润？"来选择自己的产量。最优反应函数捕捉了这种战略相互依存——如果竞争对手生产更多，我应该生产更少（因为总产量决定价格）。均衡是两家企业同时做出最优反应的点：双方都不想改变。每家双寡头企业生产竞争性产量的三分之一；合计生产三分之二。

为什么这很重要： 古诺模型表明寡头垄断的结果介于垄断和完全竞争之间。企业数量越多，市场越接近竞争性结果。这是反垄断直觉关于市场集中度的正式基础：企业越少意味着价格越高、无谓损失越大。

什么发生变化： 当竞争对手扩大产量时，最优反应是收缩——反应函数向下倾斜。向市场增加更多企业缩小了每家企业的份额，使价格趋近于边际成本。有2家企业时，行业生产竞争性产量的2/3；有5家时生产5/6；有20家时市场基本上是竞争性的。较高的边际成本使所有企业的均衡转向更低产量和更高价格。

在完整模式下，方程6.7-6.10推导最优反应函数，并求解古诺-纳什均衡。

直觉模式

这说明了什么： 随着企业数量增加，每家企业的市场份额缩小，总产量上升。当企业数量足够多时，寡头结果变得与完全竞争无法区分：价格等于边际成本，经济利润消失，无谓损失消除。

为什么这很重要： 这是古诺收敛结果——它提供了垄断（一家企业、最大市场势力）与完全竞争（众多企业、零市场势力）之间的桥梁。它赋予"竞争越多越好"这一直觉以精确含义：每增加一家企业，价格就向成本迈近一步。

什么发生变化： 有2家企业时，加成相当可观。有5家时，加成小得多。有20家时，市场基本上是竞争性的。收敛速度取决于成本结构：当边际成本相对于需求较高时，较少的企业就足以使市场趋向竞争性结果。

在完整模式下，n家企业的古诺公式展示了企业数量、产量、价格和福利之间的精确关系。

6.6 伯特兰竞争

结构	产量	价格	行业利润	无谓损失
竞争	90	10	0	0
古诺双寡头	60	40	1,800	450
垄断	45	55	2,025	1,012.5

在伯特兰模型中，企业同时选择价格（而非产量）。在产品相同且边际成本相等时：

直觉模式

这说明了什么： 当两家企业销售相同产品并在价格上竞争时，一种无情的削价逻辑将价格一路压低至边际成本。如果A企业收\$20而B企业收\$19.99，所有顾客都会去B。于是A降至\$19.98，然后B降至\$19.97——如此循环，直到任何一方再降价都会亏本。结果：只有两家企业却实现了竞争性结果。

为什么这很重要： 这是伯特兰悖论——它说明企业数量不是决定市场势力的因素。重要的是企业如何竞争。数量竞争（古诺）在少数企业的情况下保留了市场势力；价格竞争（伯特兰）立即摧毁了市场势力。现实问题是哪个模型更适合特定行业。

什么发生变化： 当产品存在差异化（小幅降价不会抢走整个市场）、企业面临产能约束（无法服务所有人）、企业重复博弈（使心照不宣的共谋成为可能）或消费者面临搜寻成本（不会立即转换）时，悖论就会消失。大多数现实市场兼具这些摩擦的某种组合，这就是为什么我们很少看到纯粹的伯特兰结果。

在完整模式下，削价论证被精确地陈述：任何P > MC都不是纳什均衡，因为任何一家企业都可以通过偏离获利。

例 6.6 —— 差异化产品的伯特兰竞争

两家企业销售差异化产品。企业 $i$ 的需求：$q_i = 100 - 2p_i + p_j$（产品是替代品但非完全相同）。边际成本：$c = 10$。

企业1最大化：$\Pi_1 = (p_1 - 10)(100 - 2p_1 + p_2)$。

一阶条件：\\$100 - 4p_1 + p_2 + 20 = 0 \implies p_1^*(p_2) = \frac{120 + p_2}{4} = 30 + p_2/4\$。

由对称性：$p^* = 30 + p^*/4 \implies p^* = 40$。

每家企业：$q^* = 100 - 80 + 40 = 60$。$\Pi^* = 30 \times 60 = 1{,}800$。

在差异化产品下，均衡价格（\\$40\$）超过边际成本（\\$10\$）。伯特兰悖论消解了，因为小幅降价不再能夺取整个市场。

6.7 施塔克尔伯格竞争

在施塔克尔伯格模型中，一家企业（领导者）先行动，选择其产量。跟随者观察领导者的选择后进行优化。领导者将跟随者的反应函数内部化。

第一步（追随者的问题）：追随者观察到 $q_1$ 并最大化 $\Pi_2 = [a - b(q_1 + q_2) - c] \cdot q_2$。这得到与古诺模型相同的最优反应函数：$q_2^*(q_1) = \frac{a - c}{2b} - \frac{q_1}{2}$。

Step 2 (Leader's problem): The leader substitutes the follower's best response into its own profit function: $\Pi_1 = [a - b(q_1 + q_2^*(q_1)) - c] \cdot q_1$. Maximizing gives:

$$q_1^S = \frac{a - c}{2b}, \quad q_2^S = \frac{a - c}{4b}$$ (Eq. 6.12-6.13)

直觉模式

这说明了什么： 当一家企业率先行动时，它可以承诺生产大量产品，迫使跟随者少生产以作配合。领导者生产竞争性产量的一半（即垄断产量）；跟随者仅生产领导者产量的一半。总产量超过古诺均衡，因此价格更低。

为什么这很重要： 承诺具有战略价值。通过先行并锁定大产量，领导者实际上在说："我会淹没这个市场——你来适应吧。"这是在产能决策难以逆转的行业（工厂、基础设施、频谱许可证）中先发优势的正式逻辑。

什么发生变化： 如果领导者的成本优势扩大，它会生产更多，进一步压缩跟随者的空间。如果承诺变得不那么可信（领导者可以轻易撤回决定），博弈会回归古诺结果，因为跟随者不再需要顺从。不对称性完全取决于领导者行动的不可逆性。

在完整模式下，方程6.12-6.13通过逆向归纳法推导斯塔克伯格产量。

领导者生产垄断产量，跟随者生产其一半。总产量超过古诺；价格更低。先行者优势来自于在跟随者选择之前承诺大产量。

例 6.4 —— 施塔克尔伯格

$P = 100 - Q$，$c = 10$：

$q_1^S = 45$，$q_2^S = 22.5$。$Q^S = 67.5$，$P^S = 32.5$。

$\Pi_1 = 1{,}012.5$（领导者），$\Pi_2 = 506.25$（跟随者）。

领导者利润超过古诺（\\$1{,}012.5 > 900\$）。跟随者境况更差（\\$506.25 < 900\$）。

6.8 博弈论导论

纳什均衡

Nash's 1950 equilibrium concept set off a revolution that rebuilt how economics models strategic interaction — from auctions to mechanism design. Its modern continuation is Chapter 12 (Mechanism Design and Market Design); its intellectual home in the history of thought is the information-economics and game-theory turn (History of Economic Thought, Ch. 11 — forthcoming). Place Nash and von Neumann among their contemporaries on the intellectual-genealogy timeline.

直觉模式

这说明了什么： 纳什均衡是每个参与者在给定其他所有人行动的情况下都在做最优选择的状态。没有人能通过单方面改变自己的策略来改善结果。可以将其视为"无悔"结果——一旦你看到所有人的选择，你不会改变你的选择。

为什么这很重要： 纳什均衡是博弈论的核心解概念，适用于远超经济学的范畴——政治学、生物学，以及任何存在战略互动的情境。它不意味着结果对社会是好的（囚徒困境表明它可能非常糟糕），只是说它是自我执行的：没有个人有偏离的动机。

什么发生变化： 当收益变化时，均衡会移动。如果背叛的惩罚增加（更强的执法、更高的罚款），合作就更容易维持。如果出现新策略，旧均衡可能瓦解。有些博弈有多个纳什均衡（协调博弈），有些恰好有一个（囚徒困境），有些在纯策略中没有——需要混合策略（随机化）。

在完整模式下，方程6.14陈述了形式化条件：没有参与者能通过单方面改变策略来提高自己的收益。

每个参与者都在对其他人做最优反应。在其他人的行为给定的情况下，没有人有理由偏离。

囚徒困境

	参与者2：合作	参与者2：背叛
参与者1：合作	(3, 3)	(0, 5)
参与者1：背叛	(5, 0)	(1, 1)

占优策略：无论对方如何选择，背叛都是最优的。纳什均衡：(背叛, 背叛)，收益为(1, 1)。双方都比相互合作(3, 3)更差，但都无法单方面改善。

直觉模式

这说明了什么： 囚徒困境捕捉了一个根本性的张力：对每个个体理性的行为导致对所有人都糟糕的结果。每个参与者推理："无论对方怎么做，我背叛都更合算。"但当双方都这样想时，他们最终陷入（背叛，背叛）——比双方合作时对双方都更糟。

为什么这很重要： 这种结构在经济学及更广范围内无处不在。卡特尔中的企业各自都有秘密增产的动机。各国都想在碳减排上搭便车。军备竞赛参与者各自都更喜欢在对方裁军时扩充武器。核心洞见：市场、制度和执法机制的存在，正是为了解决囚徒困境——将个人激励转向对社会更有利的结果。

什么发生变化： 如果诱惑收益（对方合作时自己背叛的收益）因惩罚、声誉效应或社会规范而缩小，合作就更容易实现。如果博弈是重复的，未来的惩罚可以维持合作（见下文重复博弈）。如果允许沟通，参与者可以协调——但前提是承诺是可执行的。

其他经典博弈

两个纳什均衡：(左, 左)和(右, 右)。挑战在于协调，而非冲突。

	参与者2：L	参与者2：R
参与者1：U	(,\n )	(,\n )
参与者1：D	(,\n )	(,\n )

	B：左	B：右
A：左	(2, 2)	(0, 0)
A：右	(0, 0)	(1, 1)

	B：歌剧	B：足球
A：歌剧	(3, 1)	(0, 0)
A：足球	(0, 0)	(1, 3)

例 6.5 —— 广告博弈中的纳什均衡

两家企业选择是否投放广告(A)或不投放(N)：

	企业2：A	企业2：N
企业1：A	(4, 4)	(7, 2)
企业1：N	(2, 7)	(5, 5)

检查占优策略。

企业1：如果企业2选择A，企业1获得4(A)对2(N) → A更好。如果企业2选择N，企业1获得7(A)对5(N) → A更好。因此A是企业1的占优策略。由对称性，A也是企业2的占优策略。

找出纳什均衡。

唯一的纳什均衡是(A, A)，收益为(4, 4)。两家企业都投放广告，尽管(N, N) = (5, 5)帕累托占优。这是一个囚徒困境：投放广告的个体激励导致了集体更差的结果。

重复博弈

当囚徒困境被重复进行（且参与者有耐心）时，合作可以维持。未来惩罚（回归背叛）的威胁使当前合作具有自我执行力。这就是无名氏定理。

在冷酷触发策略（合作直到对方背叛，然后永远背叛）下，合作是可持续的，条件为：

$$\delta \geq \frac{\pi_D - \pi_C}{\pi_D - \pi_N}$$ (Eq. 6.15)

其中 $\pi_C$ 是每期合作收益，$\pi_D$ 是一次性偏离收益，$\pi_N$ 是纳什（惩罚）收益。在标准囚徒困境收益（CC=3，DC=5，DD=1）下：$\delta \geq (5-3)/(5-1) = 1/2$。

直觉模式

这说明了什么： 重复博弈中的合作是一个成本收益计算：短期的作弊诱惑（在对方合作时单次背叛的收益）与长期惩罚（永远陷入相互背叛）之间的权衡。如果参与者足够有耐心（高折现因子），未来的惩罚超过了即时收益，合作就可以自我执行。

为什么这很重要： 这解释了为什么卡特尔、军控协议和贸易协定即使没有外部执法也能运作。报复的威胁（价格战、关税升级、军备竞赛）维持了合作——只要预期关系会持续下去。它也解释了为什么当企业没有耐心、博弈有已知的终止日期，或者作弊难以被发现时，合作会崩溃。

什么发生变化： 折现因子越高（越有耐心），合作越容易。诱惑收益越大，越难合作。如果惩罚较轻（纳什收益接近合作收益），合作需要更多耐心。这就是为什么欧佩克难以维持产量配额：超产的诱惑很大，发现作弊的速度很慢，而惩罚也很弱。

在完整模式下，方程6.15从冷酷触发策略推导临界贴现因子。

直觉是：今天的合作维持了关系。欺骗带来短期收益但永远触发惩罚。如果折现因子 $\delta$ 足够高，惩罚的长期成本超过短期收益。

市场结构比较

市场结构	企业数量	价格	产量	利润	无谓损失	战略性？
完全竞争	多	$P = MC$	最高	零（长期）	无	No
垄断竞争	多	$P > MC$	低于竞争	零（长期）	小	No
古诺寡头垄断	Few	$MC < P < P_M$	介于之间	正	中等	是（Q）
施塔克尔伯格	Few	低于古诺	更高	领导者 > 古诺	更少	是（序贯）
伯特兰（同质）	Two	$P = MC$	竞争水平	零	无	是（P）
垄断	One	最高	最低	最高	最大	No

主线案例：玛雅的企业

竞争对手内特在街对面开了一个柠檬水摊。两人有相同的成本结构。社区需求为 $P = 5 - (Q_M + Q_N)/20$，$MC = 1.50$。

古诺均衡： \$Q_M^* = Q_N^* = 23.3\$ 杯。\$P = 2.67\$。玛雅的利润：\\$17.2/天（仅材料成本）。

施塔克尔伯格（玛雅为领导者）： \$Q_M^S = 35\$，\$Q_N^S = 17.5\$。\$P = 2.375\$。玛雅的利润：\\$10.6/天——由于先行者优势略高。

内特进入市场后，玛雅的产量从45杯降至23.3杯，价格从\\$1.75降至\\$1.67。

结论

长期完全竞争：$P = MC = AC_{min}$，经济利润为零，资源配置有效。
垄断：$MR = MC$，$P > MC$，无谓损失，正利润。勒纳指数 $= 1/|\varepsilon_d|$ 衡量市场力量。
价格歧视攫取更多剩余：一级价格歧视获取全部消费者剩余；三级价格歧视对弹性较低的群体收取更高价格。
垄断竞争将差异化与自由进入相结合：长期利润为零但价格高于边际成本。
古诺（同时选择产量）：价格介于垄断和竞争水平之间；当 $n \to \infty$ 时趋近竞争。
伯特兰（同时选择价格）：产品相同时，即使只有两家企业，$P = MC$（伯特兰悖论）。
施塔克尔伯格（序贯选择产量）：领导者产量更大、利润更高；跟随者被压缩。
纳什均衡：没有参与者能通过单方面偏离来改善。囚徒困境展示了个体理性如何导致集体无效率。重复博弈可以维持合作。

关键公式

标签	方程	描述
式 6.1	$P = MC = AC_{min}$, $\Pi = 0$	长期竞争均衡
式 6.2	$\max \Pi = P(Q)Q - TC(Q)$	垄断者的问题
式 6.3	$MR = P + Q(dP/dQ)$	边际收益
式 6.4	$MR = MC$	垄断利润最大化条件
式 6.5	$(P-MC)/P = 1/\|\varepsilon_d\|$	勒纳指数
式 6.6	$MR_1 = MR_2 = MC$	三级价格歧视
式 6.7–6.8	最优反应函数	古诺反应函数
式 6.9	$q_i^C = (a-c)/(3b)$	古诺对称均衡
式 6.10	$P^C = (a+2c)/3$	古诺价格
式 6.11	$P^B = c$	伯特兰均衡（同质产品）
式 6.12–6.13	$q_1^S = (a-c)/(2b)$, $q_2^S = (a-c)/(4b)$	施塔克尔伯格产量
式 6.14	$u_i(s_i^, s_{-i}^) \geq u_i(s_i, s_{-i}^*)$ 对所有 $s_i$ 成立	纳什均衡
Eq. 6.15	$\delta \geq (\pi_D - \pi_C)/(\pi_D - \pi_N)$	Cooperation threshold (grim trigger)

练习题

基础练习

一个垄断者面对 $P = 50 - Q$，$MC = 10$。求垄断价格、产量、利润和无谓损失。计算勒纳指数并验证它等于 $1/|\varepsilon_d|$。
一个垄断者在两个市场销售：$P_1 = 24 - Q_1$ 和 $P_2 = 16 - 2Q_2$，$MC = 4$。求每个市场的利润最大化价格和产量。哪个市场的需求弹性更大？
两个古诺双寡头面对 $P = 80 - Q$，$c_1 = c_2 = 8$。求：(a) 每家企业的产量，(b) 市场价格，(c) 每家企业的利润。将总行业产量和利润与垄断情形比较。
将练习3作为施塔克尔伯格博弈重做，企业1为领导者。
找出所有纯策略纳什均衡：

B: X B: Y

A: X (3, 3) (1, 4)

A: Y (4, 1) (2, 2)

这是囚徒困境吗？为什么？

	B: X	B: Y
A: X	(3, 3)	(1, 4)
A: Y	(4, 1)	(2, 2)

应用练习

为什么伯特兰悖论不适用于可口可乐和百事可乐？指出真实软饮料市场的三个具体特征，说明为什么价格不会降至边际成本。
两个加油站位于十字路口的对角。它们销售相同的汽油并每天观察对方的价格。解释为什么伯特兰模型预测 $P = MC$，然后解释为什么实际中加油站能维持高于MC的价格。
一家制药公司持有某药品的专利（垄断）。当专利到期后，仿制药竞争者进入。使用完全竞争模型，预测以下变量的变化：价格、产量、生产者剩余、消费者剩余和无谓损失。专利制度是否有效？
考虑一个有一家在位企业和一家潜在进入者的市场。在位者可以设定"限制性价格"——使进入无利可图的低价——或高垄断价格。将此分析为序贯博弈。在什么条件下限制定价是可信的？

挑战题

推导需求为 $P = a - bQ$、边际成本为常数 $c$ 的 $n$ 家对称企业的古诺均衡。证明当 $n \to \infty$ 时，$P \to c$ 且结果趋向完全竞争。在 $n$ 为多少时，古诺价格达到竞争价格的10%以内？
在古诺双寡头中，企业考虑组建卡特尔。(a) 求卡特尔产量和利润。(b) 证明每家企业都有欺骗的激励。(c) 在以古诺回归为惩罚的无限重复博弈中，什么折现因子 $\delta$ 使合作可持续？
证明垄断者永远不会在需求曲线的非弹性部分运营。（提示：证明如果 $|\varepsilon_d| < 1$，垄断者可以通过减少产量来增加利润。）

你已完成第二部分 —— 微观

你现在可以评估：

大科技是否是垄断问题
超越简单供需的战略性贸易论据

你可以探索的大问题：

Are people rational? (now that you know what rational choice formally requires)
Is free trade always good? (with market power)
Is Big Tech a monopoly problem? (the Lerner index meets the platform giants)
Is competition a state or a process? (the snapshot vs. the movie)
Why is US healthcare so expensive? (provider concentration and rents)
Is industrial policy back, and is it justified? (when Cournot vs. Bertrand flips the answer)

第三部分预告：宏观经济学把尺度从企业提升到国家。

第6章市场结构与博弈论

引言

6.1 完全竞争：长期均衡

6.2 垄断

边际收益

边际收益与弹性的关系

勒纳指数

互动图表：垄断定价

"Amazon is a monopoly even though prices are low" — Lina Khan, Yale Law Journal, 2017

流行版本

最强支持论点

最强反对论点

判断

6.3 价格歧视

一级（完全）价格歧视

二级价格歧视

三级价格歧视

互动图表：三级价格歧视

6.4 垄断竞争

6.5 寡头垄断：古诺竞争

古诺模型

互动图表：N家企业的古诺模型

互动图表：古诺反应函数

6.6 伯特兰竞争

6.7 施塔克尔伯格竞争

互动图表：施塔克尔伯格与古诺比较

6.8 博弈论导论

纳什均衡

囚徒困境

互动图表：2×2博弈收益探索器

其他经典博弈

重复博弈

互动图表：重复博弈——合作门槛

市场结构比较

主线案例：玛雅的企业

结论

关键公式

练习题

基础练习

应用练习

挑战题

你已完成第二部分 —— 微观

你现在可以评估：

你可以探索的大问题：