第6章市场结构与博弈论

引言

第5章推导了竞争性企业的供给曲线:在 $P = MC$ 处生产。但这一结果假设企业是价格接受者——相对于市场而言太小,无法影响价格。许多现实市场违反了这一假设。单一卖方(垄断者)自行定价。少数大型企业(寡头垄断者)必须考虑竞争对手的反应。本章描绘市场结构的谱系,并引入博弈论作为战略互动的语言。

学完本章后,你将能够:
  1. 描述长期竞争均衡的特征并解释零利润条件
  2. 求解垄断者的定价问题并计算无谓损失
  3. 分析价格歧视(一级、二级和三级)
  4. 求解古诺、伯特兰和施塔克尔伯格寡头垄断模型
  5. 在标准型博弈中找出纳什均衡
  6. 将囚徒困境应用于经济学场景

前置知识:第5章(成本曲线、利润最大化、拉格朗日乘数法)。

6.1 完全竞争:长期均衡

在第5章中,我们证明了竞争性企业在 $P = MC$ 处实现利润最大化。在长期中,自由进入和退出导致进一步的结果。

长期竞争均衡。 在长期,当现有企业获得正经济利润(吸引新企业进入)时发生进入,当企业获得负利润时发生退出。进入使市场供给曲线右移,推动价格下降;退出使供给曲线左移,推动价格上升。这一过程持续到:
$$P = MC = AC_{min} \quad \text{且} \quad \Pi = 0$$ (Eq. 6.1)
经济利润与会计利润。 经济利润扣除所有成本,包括所有者资本和时间的机会成本。会计利润只扣除显性(货币)成本。在长期竞争均衡中,经济利润为零,但会计利润为正。

经济利润为零并不意味着企业遭受损失。这意味着它们获得了正常回报——恰好覆盖所有成本,包括资本的机会成本。会计利润仍然为正。

6.2 垄断

垄断。 只有一个卖方的市场。垄断者面对整个市场需求曲线,选择产量(或等价地,价格)以最大化利润。
$$\max_Q \; \Pi = P(Q) \cdot Q - TC(Q)$$ (Eq. 6.2)

其中 $P(Q)$ 是反需求函数——它给出垄断者要销售 $Q$ 单位必须设定的价格。与竞争企业(以价格为给定)不同,垄断者认识到增加销量需要降低价格。

直觉模式

这说明了什么: 垄断者通过平衡两种力量来决定生产多少:生产更多意味着额外销售带来更多收入,但也意味着必须降低每一单位的价格。利润是总收入减去总成本,垄断者选择利润差额最大的产量。

为什么这很重要: 与简单地接受市场价格并决定产量的竞争性企业不同,垄断者通过产量决策来控制价格。这一单一差异——企业面对整条需求曲线而非水平价格线——产生了所有垄断理论:产量受限、价格更高以及无谓损失。

什么发生变化: 如果成本上升,垄断者产量减少,价格提高。如果需求向外移动(消费者增加、支付意愿提高),垄断者产量增加,但价格也提高——将很大一部分增量以利润形式收入囊中,而非以更低价格回馈消费者。

在完整模式下,方程6.2陈述了形式化的最优化问题。

边际收益

边际收益。 销售额外一个单位所带来的额外收入。对于价格接受者企业,$MR = P$。对于具有市场力量的企业,$MR < P$,因为增加产出需要降低所有已售单位的价格。
$$MR = \frac{dTR}{dQ} = P + Q\frac{dP}{dQ}$$ (Eq. 6.3)

边际收益由两部分构成:

产量效应与价格效应。 产出效应是以当前价格销售额外一个单位所获得的收益。价格效应是因降低所有内部边际单位价格而造成的损失。边际收入是这两种力量的净值:$MR = \underbrace{P}_{\text{产出效应}} + \underbrace{Q \cdot dP/dQ}_{\text{价格效应}}$。

对于向下倾斜的需求曲线,$dP/dQ < 0$,所以 $MR < P$。对于线性需求 $P = a - bQ$:$TR = aQ - bQ^2$,所以 $MR = a - 2bQ$。MR曲线与需求曲线有相同的截距但斜率是两倍。

边际收益与弹性的关系

$$MR = P\left(1 - \frac{1}{|\varepsilon_d|}\right)$$

垄断者永远不会在 $MR < 0$ 处生产(因为减少产量反而能增加收入),因此垄断者只在需求的弹性区间运营,即 $|\arepsilon_d| > 1$。

利润最大化条件:

$$MR = MC$$ (Eq. 6.4)
直觉模式

这说明了什么: 边际收入是多销售一单位所带来的额外收入。对于面对向下倾斜需求曲线的垄断者而言,MR始终低于价格,因为为了多销售一单位而降价会减少所有现有单位的收入。

为什么这很重要: 价格与MR之间的差距正是垄断者限制产量的原因——他们在竞争性产量之前就停止生产,因为每增加一单位都会侵蚀之前销售的收入。企业通过将产量维持在MR恰好等于MC的水平来最大化利润。

什么发生变化: 当需求弹性增大(消费者对价格更敏感)时,MR更接近价格,垄断者的行为更像竞争性企业。当需求缺乏弹性时,MR实际上是负值——垄断者绝不会在需求缺乏弹性的区间内生产。

在完整模式下,方程6.3–6.4从收入函数推导边际收入,并展示利润最大化条件。

勒纳指数

勒纳指数。 市场力量的衡量指标:
$$\frac{P - MC}{P} = \frac{1}{|\varepsilon_d|}$$ (Eq. 6.5)
直觉模式

这说明了什么: 价格弹性越大(消费者有更多替代品),勒纳指数越小,垄断者的加成越小——价格趋近于边际成本。当需求极度缺乏弹性时(几乎没有替代品),垄断者可以收取更高的加成。这就是为什么拥有专利药品的制药公司定价远高于成本,而面临卫星竞争的地方有线电视公司则不能。

为什么这很重要: 这就是垄断者限制产量、抬高价格的原因——不是出于恶意,而是因为面对向下倾斜需求曲线的数学逻辑使以更高价格少卖变得有利可图。无谓损失来自那些消费者估价高于生产成本的单位,但垄断者选择不出售,因为出售这些单位需要对所有其他单位降价。

什么发生变化: 当需求弹性增大(消费者拥有更多替代品)时,勒纳指数下降,垄断者的加成收窄——价格趋近于边际成本。当需求极度缺乏弹性(几乎没有替代品)时,垄断者可以收取更高的加成。这就是为什么拥有专利药品的制药公司定价远高于成本,而面临卫星竞争的地方有线电视公司则不能。

在完整模式下,方程6.5从MR = MC条件推导勒纳指数。

边际成本之上的加价等于需求价格弹性(绝对值)的倒数。需求弹性越大意味着市场力量越小。

例 6.1 —— 垄断定价

需求:$P = 100 - 2Q$。成本:$TC = 20Q$(常数 $MC = 20$)。

$TR = 100Q - 2Q^2$,$MR = 100 - 4Q$。

\$MR = MC\$:\\$100 - 4Q = 20 \implies Q_M = 20\$,\$P_M = 60\$。

$\Pi = (60 - 20)(20) = 800$。

竞争结果:$P = MC = 20$,$Q_C = 40$。

$DWL = \frac{1}{2}(60 - 20)(40 - 20) = 400$。

勒纳指数:$(60 - 20)/60 = 2/3$。验证:$\varepsilon_d = (dQ/dP)(P/Q) = (-1/2)(60/20) = -1.5$,所以 $1/|\varepsilon_d| = 2/3$。✓

互动图表:垄断定价

调整边际成本,观察垄断者的最优价格、产量、利润和无谓损失如何变化。切换竞争结果叠加层进行比较。

\$1 \$15 \$10
垄断: QM = 20  |  PM = \$10.00  |  利润 = \$100.00  |  DWL = \$100.00  |  Lerner = 0.667

图 6.2.垄断者将产量限制在MR = MC处,定价高于边际成本。蓝色矩形是垄断利润;黄色三角形是无谓损失。切换竞争叠加层可以看到有效结果。

观点

"Amazon is a monopoly even though prices are low" — Lina Khan, Yale Law Journal, 2017

Lina Khan was a 28-year-old law student when she published "Amazon's Antitrust Paradox." The article was so influential it got her appointed chair of the FTC. Her claim: the consumer welfare standard that has governed antitrust since the 1980s is blind to Amazon's power because it only looks at prices. Amazon keeps prices low, so the standard says there's no problem. Khan says the standard is broken. By the Lerner index you just learned, she's making a radical claim: market power can exist even when $(P - MC)/P$ is near zero.

中级

6.3 价格歧视

价格歧视。 根据支付意愿而非成本差异,对不同消费者(或不同单位)收取不同价格。

一级(完全)价格歧视

企业对每个消费者收取其最高支付意愿。这提取了全部消费者剩余。产量是有效的($Q = Q_C$)——没有无谓损失——但所有剩余归企业所有。

二级价格歧视

企业提供不同的定价方案(数量折扣、捆绑销售、版本定价)让消费者自行选择。例如:机票(商务舱与经济舱)、软件(基础版与专业版)、批量定价。

三级价格歧视

企业识别具有不同弹性的群体,对每个群体收取不同的价格:

$$MR_1 = MR_2 = MC$$ (Eq. 6.6)

由于 $MR = P(1 - 1/|\varepsilon|)$(来自MR与弹性的关系),各市场上MR相等意味着需求弹性较小的群体(替代品较少、转换成本较高)必须被收取更高的价格。最优价格比满足 $P_1/P_2 = (1 - 1/|\varepsilon_2|)/(1 - 1/|\varepsilon_1|)$。

直觉模式

这说明了什么: 实施价格歧视的企业在所有市场中将边际收入设定相等,并等于边际成本。这意味着企业对价格不敏感的顾客(需求弹性较小的顾客)收取更高价格,对价格更敏感的顾客收取更低价格。

为什么这很重要: 这是学生折扣、老年人优惠价、区域定价和峰值定价背后的逻辑。企业不是在怜悯学生——而是通过对支付意愿不同的群体收取不同价格来获取更多总收入。航空公司将这一点做到极致:商务旅客支付更多,因为他们的灵活性更低。

什么发生变化: 如果市场间弹性差距缩小(两组消费者对价格同样敏感),最优价格趋于一致,价格歧视变得无利可图。如果套利成为可能(学生将折扣票转售给成人),价格歧视就会崩溃为单一价格。

在完整模式下,MR-弹性关系式精确地展示了价格比如何取决于需求弹性。

需求弹性更低的群体支付更高的价格。

例 6.2 —— 三级价格歧视

一家剧院面对两个市场。成人需求:$P_A = 20 - Q_A$。学生需求:$P_S = 12 - Q_S$。$MC = 2$。

成人:$MR_A = 20 - 2Q_A = 2 \implies Q_A = 9$,$P_A = 11$。

学生:$MR_S = 12 - 2Q_S = 2 \implies Q_S = 5$,$P_S = 7$。

总利润:$(11-2)(9) + (7-2)(5) = 81 + 25 = 106$。

互动图表:三级价格歧视

两个需求弹性不同的市场。调整MC,观察每个市场的最优价格和产量如何变化。

\$1 \$1 \$10
市场A(成人): Q = 9.0, P = \$11.00, 利润 = \$11.00  |  市场B(学生): Q = 5.0, P = \$1.00, 利润 = \$15.00

市场A(成人): $P_A = 20 - Q_A$

市场B(学生): $P_S = 12 - Q_S$

6.4 垄断竞争

垄断竞争。 一个有许多企业销售差异化产品的市场。每个企业由于产品差异化而拥有一定的市场力量(需求曲线向下倾斜),但面临自由进入。

短期:企业可能获得正利润或负利润。长期:进入和退出驱动经济利润归零。

在长期均衡中,每家企业在其需求曲线与平均成本曲线相切处生产。切线条件同时施加两个要求:

$$P = AC \quad \text{(zero profit)} \quad \text{and} \quad MR = MC \quad \text{(profit maximization)}$$ (Eq. 6.8)

由于企业面临向下倾斜的需求曲线,切点出现在平均成本最低点的左侧——企业在低于有效规模的水平上生产。

直觉模式

这说明了什么: 从长期来看,垄断竞争产生一种独特的结果:企业获得零经济利润(自由进入竞争掉了利润),但仍然收取高于边际成本的价格(产品差异化使每家企业在其特定品种上拥有小型垄断地位)。企业的经营规模低于平均成本最小化的规模。

为什么这很重要: 这是"多样性的代价"。拥有50家不同餐厅而非50家相同食堂,意味着每家餐厅服务的顾客更少,经营规模低于最有效率的水平。这是否真的低效,取决于消费者对差异化本身的重视程度。

什么发生变化: 如果产品变得更不差异化(替代性更强),每家企业的需求曲线变得更有弹性,加成收窄,结果趋近于完全竞争。如果进入壁垒提高,企业在长期内能维持正的利润——结果趋近于垄断。

在完整模式下,方程6.8展示了确定长期均衡的切线条件。

这意味着垄断竞争相对于完全竞争有两种"低效":

  1. 加价:$P > MC$(来自差异化的市场力量)
  2. 过剩产能:企业在低于最小化平均成本的规模下生产

这些是否真的低效是有争议的。Dixit-Stiglitz框架表明消费者重视多样性——拥有50家不同的餐厅比50家相同的餐厅更有价值,即使相同的餐厅更便宜。边际成本之上的加价是"多样性的价格"。

经典问题 #5

自由贸易总是好的吗?

在第2章中,比较优势在完全竞争下为自由贸易做出了干净的论证。你现在掌握了垄断竞争和策略性互动。下面说明不完全竞争如何使那个故事复杂化。

模型的解释

在垄断竞争下(Krugman 1980),贸易允许更多产品种类并利用规模经济:带来超越比较优势的贸易收益。其驱动力是消费者对多样性的偏好和企业层面的规模报酬,因此即使各国的基本禀赋相似,贸易仍然会发生。在古诺寡头下(Brander-Spencer 1985),对本国企业的政府补贴可以把纳什均衡向其有利方向移动,从外国对手那里攫取租金。幼稚产业论也获得了形式化基础:如果生产涉及边做边学(成本随累积产出下降),临时保护可以让企业沿成本曲线下移,使其在长期具有竞争力。战略性贸易理论说,在不完全竞争下,贸易政策可以在国家之间转移利润,自由贸易不再自动最优。

最强的反驳

反对战略性贸易:它要求政府挑选赢家——识别哪些产业具有合适的市场结构和学习曲线使干预奏效。政府失灵(游说、腐败、信息问题)使这在实践中很危险。有益战略性贸易的理论条件是刀尖上的:政府必须了解需求弹性、成本结构以及对手政府的反应。反对幼稚产业:历史记录不一——许多"幼稚"产业从未长大。保护为政治上有关系的企业制造租金,而非真正的学习。而且一旦授予了保护,取消保护的政治经济学是残酷的——受益者会游说使其永久化。

主流的回应

中国冲击文献之后主流观点发生了转变。2010年之前,共识强烈支持自由贸易,以再分配作为配套政策。2010年之后,学界承认贸易的调整成本比此前假定的更大、更持久、在地理上更集中(Autor, Dorn & Hanson 2013, 2016)。本应补偿输家的贸易调整援助项目规模小、效果差。克鲁格曼本人——部分因为证明了不完全竞争下的贸易收益而获得诺奖——承认分配效应被低估了数十年。

判断(在当前水平)

自由贸易在大多数时候对大多数国家仍是净正向的——第2章的比较优势逻辑是稳健的,克鲁格曼的垄断竞争模型增加了来自种类和规模的进一步收益。但无条件的论据已经变弱。分配效应比学界数十年承认的更大,补偿机制已经失败。战略性贸易和幼稚产业论在理论上有价值,但在实践中危险——政府失灵是具有约束力的制约。诚实的答案:自由贸易是正确的默认,策略性干预可以奏效但通常不会,贸易的输家需要真正的补偿,而非承诺。

目前无法解决的问题

此处的模型是静态的——它们比较一个均衡与另一个均衡。在一个有供应链依赖(半导体、稀土、能源)的世界里,我们该如何思考贸易?保护的经济安全论据与效率论据不同。而且宏观经济维度完全缺失:贸易逆差、资本流动和汇率都影响这个故事。请在第17章(§17.1–17.7)回来看,那里开放经济宏观框架把国际收支核算、不可能三位一体和全球失衡加入画面。

相关观点

观点

“关税真的有效吗?”

“关税人”说关税让美国更富。经济学家说这是对美国消费者征税。2018年贸易战提供了现代数据中的首个重大检验案例。

中级
← 上一站:第2章 —— 比较优势 第2站,共4站 下一站:第17章 —— 开放经济宏观 →

6.5 寡头垄断:古诺竞争

寡头垄断。 一个只有少数大企业的市场,每个企业都意识到自己的行动会影响其他企业。战略互动是其决定性特征。

古诺模型

古诺竞争。 一种寡头模型,其中企业同时选择产量。每个企业选择在给定其对其他企业产量的预期下最大化利润的产量。

企业同时选择产量。每家企业的最优产量取决于其他企业的产量。

两家企业,需求 $P = a - b(q_1 + q_2)$,两家的边际成本均为常数 $c$。

最优反应(反应)函数。 企业 $i$ 的最优产量作为竞争对手产量的函数:$q_i^*(q_j)$。它求解 $\max_{q_i} \Pi_i = (P(q_i + q_j) - c) q_i$。在古诺均衡中,每个企业同时处于其最佳反应函数上。

企业1的最优反应函数

Firm 1 maximizes $\Pi_1 = [a - b(q_1 + q_2) - c] \cdot q_1$. Taking the first-order condition:

$$\frac{\partial \Pi_1}{\partial q_1} = a - 2bq_1 - bq_2 - c = 0$$ (Eq. 6.7a)

对 $q_1$ 求解得到最优反应函数:

$$q_1^*(q_2) = \frac{a - c}{2b} - \frac{q_2}{2}$$ (Eq. 6.7)

古诺-纳什均衡(联立求解):

$$q_1^C = q_2^C = \frac{a - c}{3b}$$ (Eq. 6.9)
$$Q^C = \frac{2(a-c)}{3b}, \quad P^C = \frac{a + 2c}{3}$$ (Eq. 6.10)
直觉模式

这说明了什么: 每家企业通过问:"给定竞争对手的产量,什么产量能最大化我的利润?"来选择自己的产量。最优反应函数捕捉了这种战略相互依存——如果竞争对手生产更多,我应该生产更少(因为总产量决定价格)。均衡是两家企业同时做出最优反应的点:双方都不想改变。每家双寡头企业生产竞争性产量的三分之一;合计生产三分之二。

为什么这很重要: 古诺模型表明寡头垄断的结果介于垄断和完全竞争之间。企业数量越多,市场越接近竞争性结果。这是反垄断直觉关于市场集中度的正式基础:企业越少意味着价格越高、无谓损失越大。

什么发生变化: 当竞争对手扩大产量时,最优反应是收缩——反应函数向下倾斜。向市场增加更多企业缩小了每家企业的份额,使价格趋近于边际成本。有2家企业时,行业生产竞争性产量的2/3;有5家时生产5/6;有20家时市场基本上是竞争性的。较高的边际成本使所有企业的均衡转向更低产量和更高价格。

在完整模式下,方程6.7-6.10推导最优反应函数,并求解古诺-纳什均衡。

$n$家企业的推广:当 $n$ 家对称企业时,每家生产 $q_i = (a-c)/((n+1)b)$,总产量为 $Q = n(a-c)/((n+1)b)$,古诺价格为 $P^C = (a + nc)/(n+1)$。当 $n \to \infty$ 时,$P \to c$——市场趋向完全竞争。

直觉模式

这说明了什么: 随着企业数量增加,每家企业的市场份额缩小,总产量上升。当企业数量足够多时,寡头结果变得与完全竞争无法区分:价格等于边际成本,经济利润消失,无谓损失消除。

为什么这很重要: 这是古诺收敛结果——它提供了垄断(一家企业、最大市场势力)与完全竞争(众多企业、零市场势力)之间的桥梁。它赋予"竞争越多越好"这一直觉以精确含义:每增加一家企业,价格就向成本迈近一步。

什么发生变化: 有2家企业时,加成相当可观。有5家时,加成小得多。有20家时,市场基本上是竞争性的。收敛速度取决于成本结构:当边际成本相对于需求较高时,较少的企业就足以使市场趋向竞争性结果。

在完整模式下,n家企业的古诺公式展示了企业数量、产量、价格和福利之间的精确关系。
例 6.3 —— 古诺双寡头

需求:$P = 100 - Q$,$c = 10$。最优反应:$q_i^* = 45 - q_j/2$。

均衡:$q_1^C = q_2^C = 30$。$Q^C = 60$,$P^C = 40$。$\Pi_i = 900$。

结构产量价格行业利润无谓损失
竞争901000
古诺双寡头60401,800450
垄断45552,0251,012.5

互动图表:N家企业的古诺模型

将企业数量从1(垄断)滑动到20。观察总产量上升、价格下降、无谓损失趋近于零——市场趋向完全竞争。

垄断 (1) 10 竞争 (20)
N = 2: qi = 30.0  |  Q = 60.0  |  P = \$10.00  |  每企业利润 = \$100.00  |  DWL = \$150.00

图 6.3a。随着N增加,古诺结果趋向完全竞争。N=1时为垄断。柱状图展示关键指标如何随市场结构变化。

互动图表:古诺反应函数

调整每家企业的边际成本,观察反应函数如何移动以及均衡点如何变化。不对称成本导致不对称产出。

\$1\$10\$10
\$1\$10\$10
均衡: q1 = 30.0, q2 = 30.0  |  Q = 60.0  |  P = \$10.00

图 6.3b。每家企业的反应函数向下倾斜:对手产量增加会降低最优反应产量。交叉点是古诺-纳什均衡。拖动成本滑块可以看到不对称成本如何移动反应函数和均衡点。

经典问题 #3

最低工资会导致失业吗?

在第2章,竞争模型给出了干净的答案:高于均衡的最低工资会造成失业。你现在掌握了垄断、寡头,以及对市场势力建模的工具。下面是当劳动市场并非竞争性时会发生什么。

模型的解释

把§6.2的垄断框架应用到劳动市场,但方向反过来:不是考虑拥有市场势力的单一卖方,而是考虑劳动的单一买方——买方垄断者。企业面对向上倾斜的劳动供给曲线 $w(L)$,$w' > 0$。劳动的边际成本超过工资:$MC_L = w + w' \cdot L$。企业在 $MC_L = MRP_L$ 处雇用,工资低于竞争水平,就业也低于竞争水平。现在在买方垄断工资与竞争工资之间施加一个最低工资。企业的劳动边际成本在最低工资处变得平坦(在一定范围内),这意味着它会雇用更多而非更少的工人。最低工资可以同时提高就业和收入。在竞争工资之上,标准的失业预测又回来了。

最强的反驳

即使单个企业拥有一些劳动市场势力,工人也能在雇主、产业和城市之间流动。劳动流动性在长期限制买方垄断势力。经验上相关的问题是实际存在多少买方垄断势力——这在不同部门、地区和工人类型之间差异巨大。小镇上的快餐可能接近买方垄断;旧金山的科技招聘则接近竞争性。"新买方垄断"文献(Manning 2003)认为搜寻摩擦和迁移成本即使在有许多雇主时也制造买方垄断势力——但其程度,以及因此最低工资的就业效应,仍然是一个仅凭理论无法裁决的经验问题。

主流的回应

主流早就把买方垄断作为一种理论可能性吸收进来——Joan Robinson在1933年将其形式化。但在Card和Krueger 1994年的标志性研究之前,学界把买方垄断视为经验上罕见,而竞争模型的失业预测是主导结果。"新买方垄断"文献把概念从"公司镇上的唯一雇主"拓展到"由于搜寻摩擦、迁移成本和信息不对称,雇主拥有一定的工资设定权"——这比教科书的买方垄断要常见得多。

判断(在当前水平)

理论现在很清楚:最低工资的效应取决于买方垄断势力的程度。"总是导致失业"和"从不导致失业"作为一般性主张都是错的。正确的理论答案是"取决于市场结构"——而市场结构因劳动市场而异。§6.5的古诺模型提供了类比:正如寡头的福利效应取决于企业数量和市场势力程度,最低工资的就业效应也取决于劳动市场的结构。竞争模型和买方垄断模型是一个谱的两端。

目前无法解决的问题

理论给出一个有条件的预测:就业效应取决于市场结构。但哪种市场结构在经验上相关?我们需要数据来裁决。请在第10章(§10.4)回来看,那里用双重差分分析Card和Krueger的自然实验——这一计量方法开启了竞争与买方垄断预测之间30年的经验之战。

相关观点

观点

「为\$15而战!」

买方垄断模型说适度上调可以提高就业。但旧金山的 \$15 与密西西比乡村的 \$15 非常不同。答案取决于当地的工资咬合度——以及当地雇主市场势力的程度。

中级
← 上一站:第2章 —— 教科书预测 第2站,共3站 下一站:第10章 —— 证据 →
经典问题 #5

自由贸易总是好的吗?

比较优势说是。但在垄断竞争与古诺寡头下,战略性贸易理论说:取决于市场结构。政府也许能够转移利润——如果它们能挑对赢家。

探索这个问题 →

6.6 伯特兰竞争

伯特兰竞争。 一种寡头模型,其中企业同时选择价格。消费者从价格最低的企业购买;如果价格相同,需求平均分配。

伯特兰模型中,企业同时选择价格(而非产量)。在产品相同且边际成本相等时:

$$P^B = c \quad \text{(伯特兰悖论)}$$ (Eq. 6.11)
伯特兰悖论。 当两个企业销售相同产品且边际成本相等时,唯一的纳什均衡是 $P = MC$ — 即完全竞争结果。悖论在于仅两个企业就足以消除所有市场力量,这与古诺模型的预测相矛盾。

仅有两家企业,价格竞争就复现了完全竞争结果。这就是伯特兰悖论:古诺模型说需要很多企业才能实现竞争;伯特兰模型说两家就够了。其逻辑是:如果一家企业定价高于 $MC$,另一家可以以微小幅度削价并夺取整个市场。这种削价持续进行,直到任何一家都无法在盈利的情况下进一步降价——此时 $P = MC$。

直觉模式

这说明了什么: 当两家企业销售相同产品并在价格上竞争时,一种无情的削价逻辑将价格一路压低至边际成本。如果A企业收\$20而B企业收\$19.99,所有顾客都会去B。于是A降至\$19.98,然后B降至\$19.97——如此循环,直到任何一方再降价都会亏本。结果:只有两家企业却实现了竞争性结果。

为什么这很重要: 这是伯特兰悖论——它说明企业数量不是决定市场势力的因素。重要的是企业如何竞争。数量竞争(古诺)在少数企业的情况下保留了市场势力;价格竞争(伯特兰)立即摧毁了市场势力。现实问题是哪个模型更适合特定行业。

什么发生变化: 当产品存在差异化(小幅降价不会抢走整个市场)、企业面临产能约束(无法服务所有人)、企业重复博弈(使心照不宣的共谋成为可能)或消费者面临搜寻成本(不会立即转换)时,悖论就会消失。大多数现实市场兼具这些摩擦的某种组合,这就是为什么我们很少看到纯粹的伯特兰结果。

在完整模式下,削价论证被精确地陈述:任何P > MC都不是纳什均衡,因为任何一家企业都可以通过偏离获利。

悖论消解的条件:

例 6.6 —— 差异化产品的伯特兰竞争

两家企业销售差异化产品。企业 $i$ 的需求:$q_i = 100 - 2p_i + p_j$(产品是替代品但非完全相同)。边际成本:$c = 10$。

企业1最大化:$\Pi_1 = (p_1 - 10)(100 - 2p_1 + p_2)$。

一阶条件:\\$100 - 4p_1 + p_2 + 20 = 0 \implies p_1^*(p_2) = \frac{120 + p_2}{4} = 30 + p_2/4\$。

由对称性:$p^* = 30 + p^*/4 \implies p^* = 40$。

每家企业:$q^* = 100 - 80 + 40 = 60$。$\Pi^* = 30 \times 60 = 1{,}800$。

在差异化产品下,均衡价格(\\$40\$)超过边际成本(\\$10\$)。伯特兰悖论消解了,因为小幅降价不再能夺取整个市场。

6.7 施塔克尔伯格竞争

施塔克尔伯格竞争。 一种序贯寡头模型,其中一个企业(领导者)首先选择产量,另一个企业(追随者)观察领导者的选择后再选择自己的产量。

施塔克尔伯格模型中,一家企业(领导者)先行动,选择其产量。跟随者观察领导者的选择后进行优化。领导者将跟随者的反应函数内部化。

第一步(追随者的问题):追随者观察到 $q_1$ 并最大化 $\Pi_2 = [a - b(q_1 + q_2) - c] \cdot q_2$。这得到与古诺模型相同的最优反应函数:$q_2^*(q_1) = \frac{a - c}{2b} - \frac{q_1}{2}$。

Step 2 (Leader's problem): The leader substitutes the follower's best response into its own profit function: $\Pi_1 = [a - b(q_1 + q_2^*(q_1)) - c] \cdot q_1$. Maximizing gives:

$$q_1^S = \frac{a - c}{2b}, \quad q_2^S = \frac{a - c}{4b}$$ (Eq. 6.12-6.13)
直觉模式

这说明了什么: 当一家企业率先行动时,它可以承诺生产大量产品,迫使跟随者少生产以作配合。领导者生产竞争性产量的一半(即垄断产量);跟随者仅生产领导者产量的一半。总产量超过古诺均衡,因此价格更低。

为什么这很重要: 承诺具有战略价值。通过先行并锁定大产量,领导者实际上在说:"我会淹没这个市场——你来适应吧。"这是在产能决策难以逆转的行业(工厂、基础设施、频谱许可证)中先发优势的正式逻辑。

什么发生变化: 如果领导者的成本优势扩大,它会生产更多,进一步压缩跟随者的空间。如果承诺变得不那么可信(领导者可以轻易撤回决定),博弈会回归古诺结果,因为跟随者不再需要顺从。不对称性完全取决于领导者行动的不可逆性。

在完整模式下,方程6.12-6.13通过逆向归纳法推导斯塔克伯格产量。
先行者优势。 在竞争对手做出反应之前承诺行动所带来的战略优势。在施塔克尔伯格模型中,领导者承诺大产量,迫使追随者通过减少产量来适应。领导者获得的利润高于同时博弈(古诺)中的利润。

领导者生产垄断产量,跟随者生产其一半。总产量超过古诺;价格更低。先行者优势来自于在跟随者选择之前承诺大产量。

例 6.4 —— 施塔克尔伯格

$P = 100 - Q$,$c = 10$:

$q_1^S = 45$,$q_2^S = 22.5$。$Q^S = 67.5$,$P^S = 32.5$。

$\Pi_1 = 1{,}012.5$(领导者),$\Pi_2 = 506.25$(跟随者)。

领导者利润超过古诺(\\$1{,}012.5 > 900\$)。跟随者境况更差(\\$506.25 < 900\$)。

互动图表:施塔克尔伯格与古诺比较

在同时博弈(古诺)和序贯博弈(施塔克尔伯格)之间切换,使用 $P = 100 - Q$、$c = 10$ 比较产量和利润。

Cournot: q1 = 30.0, q2 = 30.0  |  Q = 60.0, P = \$10.00  |  Π1 = \$100, Π2 = \$100

图 6.4.比较古诺(对称)和施塔克尔伯格(领导者优势)。在反应函数图上,施塔克尔伯格均衡位于古诺的右下方:领导者产量更多,跟随者产量更少。

6.8 博弈论导论

标准型(策略型)博弈。 由以下要素组成:(1) 参与者 $i = 1, 2, \ldots, n$;(2) 每个参与者的策略 $S_i$;(3) 每种策略组合的收益 $u_i(s_1, \ldots, s_n)$。

纳什均衡

纳什均衡。 一组策略组合 $(s_1^*, s_2^*, \ldots, s_n^*)$,使得没有任何参与者能够通过单方面改变策略来提高其收益。每个参与者都在对其他所有参与者的策略做出最优反应。
$$u_i(s_i^*, s_{-i}^*) \geq u_i(s_i, s_{-i}^*) \quad \forall s_i \in S_i, \; \forall i$$ (Eq. 6.14)
直觉模式

这说明了什么: 纳什均衡是每个参与者在给定其他所有人行动的情况下都在做最优选择的状态。没有人能通过单方面改变自己的策略来改善结果。可以将其视为"无悔"结果——一旦你看到所有人的选择,你不会改变你的选择。

为什么这很重要: 纳什均衡是博弈论的核心解概念,适用于远超经济学的范畴——政治学、生物学,以及任何存在战略互动的情境。它不意味着结果对社会是好的(囚徒困境表明它可能非常糟糕),只是说它是自我执行的:没有个人有偏离的动机。

什么发生变化: 当收益变化时,均衡会移动。如果背叛的惩罚增加(更强的执法、更高的罚款),合作就更容易维持。如果出现新策略,旧均衡可能瓦解。有些博弈有多个纳什均衡(协调博弈),有些恰好有一个(囚徒困境),有些在纯策略中没有——需要混合策略(随机化)。

在完整模式下,方程6.14陈述了形式化条件:没有参与者能通过单方面改变策略来提高自己的收益。

每个参与者都在对其他人做最优反应。在其他人的行为给定的情况下,没有人有理由偏离。

囚徒困境

占优策略。 一种无论其他参与者如何行动都能产生弱优收益的策略。如果 $s_i^*$ 是占优策略,则 $u_i(s_i^*, s_{-i}) \geq u_i(s_i, s_{-i})$ 对所有 $s_i$ 和所有 $s_{-i}$ 成立。
囚徒困境。 一个两人博弈,其中每个参与者都有背叛的占优策略,但相互合作能为双方带来更高的收益。纳什均衡(背叛,背叛)被(合作,合作)帕累托支配,说明了个体理性与集体福利之间的矛盾。
参与者2:合作参与者2:背叛
参与者1:合作(3, 3)(0, 5)
参与者1:背叛(5, 0)(1, 1)

占优策略:无论对方如何选择,背叛都是最优的。纳什均衡:(背叛, 背叛),收益为(1, 1)。双方都比相互合作(3, 3)更差,但都无法单方面改善。

直觉模式

这说明了什么: 囚徒困境捕捉了一个根本性的张力:对每个个体理性的行为导致对所有人都糟糕的结果。每个参与者推理:"无论对方怎么做,我背叛都更合算。"但当双方都这样想时,他们最终陷入(背叛,背叛)——比双方合作时对双方都更糟。

为什么这很重要: 这种结构在经济学及更广范围内无处不在。卡特尔中的企业各自都有秘密增产的动机。各国都想在碳减排上搭便车。军备竞赛参与者各自都更喜欢在对方裁军时扩充武器。核心洞见:市场、制度和执法机制的存在,正是为了解决囚徒困境——将个人激励转向对社会更有利的结果。

什么发生变化: 如果诱惑收益(对方合作时自己背叛的收益)因惩罚、声誉效应或社会规范而缩小,合作就更容易实现。如果博弈是重复的,未来的惩罚可以维持合作(见下文重复博弈)。如果允许沟通,参与者可以协调——但前提是承诺是可执行的。

囚徒困境为何重要:

互动图表:2×2博弈收益探索器

输入2×2博弈的任意收益。工具自动识别占优策略、纳什均衡和帕累托最优结果。绿色单元格为纳什均衡;蓝色边框标记帕累托最优结果。

参与者2:L 参与者2:R
参与者1:U (,\n ) (,\n )
参与者1:D (,\n ) (,\n )

蓝色 = 参与者1的收益  |  红色 = 参与者2的收益

Analyzing...

其他经典博弈

协调博弈:

B:左B:右
A:左(2, 2)(0, 0)
A:右(0, 0)(1, 1)

两个纳什均衡:(左, 左)和(右, 右)。挑战在于协调,而非冲突。

性别之战:

B:歌剧B:足球
A:歌剧(3, 1)(0, 0)
A:足球(0, 0)(1, 3)

两个纯策略纳什均衡,每个参与者有不同的偏好结果。

例 6.5 —— 广告博弈中的纳什均衡

两家企业选择是否投放广告(A)或不投放(N):

企业2:A企业2:N
企业1:A(4, 4)(7, 2)
企业1:N(2, 7)(5, 5)

检查占优策略。

企业1:如果企业2选择A,企业1获得4(A)对2(N) → A更好。如果企业2选择N,企业1获得7(A)对5(N) → A更好。因此A是企业1的占优策略。由对称性,A也是企业2的占优策略。

找出纳什均衡。

唯一的纳什均衡是(A, A),收益为(4, 4)。两家企业都投放广告,尽管(N, N) = (5, 5)帕累托占优。这是一个囚徒困境:投放广告的个体激励导致了集体更差的结果。

重复博弈

重复博弈。 一个相同的阶段博弈由相同参与者重复进行多次(或无限次)的博弈。重复互动允许策略以历史为条件(例如,“在有人背叛之前一直合作”),从而可能维持在一次性博弈中不可能实现的合作。

当囚徒困境被重复进行(且参与者有耐心)时,合作可以维持。未来惩罚(回归背叛)的威胁使当前合作具有自我执行力。这就是无名氏定理

冷酷触发策略(合作直到对方背叛,然后永远背叛)下,合作是可持续的,条件为:

$$\delta \geq \frac{\pi_D - \pi_C}{\pi_D - \pi_N}$$ (Eq. 6.15)

其中 $\pi_C$ 是每期合作收益,$\pi_D$ 是一次性偏离收益,$\pi_N$ 是纳什(惩罚)收益。在标准囚徒困境收益(CC=3,DC=5,DD=1)下:$\delta \geq (5-3)/(5-1) = 1/2$。

直觉模式

这说明了什么: 重复博弈中的合作是一个成本收益计算:短期的作弊诱惑(在对方合作时单次背叛的收益)与长期惩罚(永远陷入相互背叛)之间的权衡。如果参与者足够有耐心(高折现因子),未来的惩罚超过了即时收益,合作就可以自我执行。

为什么这很重要: 这解释了为什么卡特尔、军控协议和贸易协定即使没有外部执法也能运作。报复的威胁(价格战、关税升级、军备竞赛)维持了合作——只要预期关系会持续下去。它也解释了为什么当企业没有耐心、博弈有已知的终止日期,或者作弊难以被发现时,合作会崩溃。

什么发生变化: 折现因子越高(越有耐心),合作越容易。诱惑收益越大,越难合作。如果惩罚较轻(纳什收益接近合作收益),合作需要更多耐心。这就是为什么欧佩克难以维持产量配额:超产的诱惑很大,发现作弊的速度很慢,而惩罚也很弱。

在完整模式下,方程6.15从冷酷触发策略推导临界贴现因子。

直觉是:今天的合作维持了关系。欺骗带来短期收益但永远触发惩罚。如果折现因子 $\delta$ 足够高,惩罚的长期成本超过短期收益。

互动图表:重复博弈——合作门槛

在标准囚徒困境(收益:CC=3, CD=0, DC=5, DD=1)中,通过冷酷触发策略实现合作需要折现因子 $\delta$ 超过某个门槛值。滑动 $\delta$ 查看合作是否可持续。

缺乏耐心 (0) 0.50 非常有耐心 (1)
计算中……

图 6.5.水平线表示维持合作所需的最低折现因子 $\delta^*$。当 $\delta > \delta^*$ 时,合作的长期价值超过一次性背叛的诱惑。图表比较了永久合作的现值与背叛一次然后永远受罚的现值。

市场结构比较

市场结构企业数量价格产量利润无谓损失战略性?
完全竞争$P = MC$最高零(长期)No
垄断竞争$P > MC$低于竞争零(长期)No
古诺寡头垄断Few$MC < P < P_M$介于之间中等是(Q)
施塔克尔伯格Few低于古诺更高领导者 > 古诺更少是(序贯)
伯特兰(同质)Two$P = MC$竞争水平是(P)
垄断One最高最低最高最大No

主线案例:玛雅的企业

竞争对手内特在街对面开了一个柠檬水摊。两人有相同的成本结构。社区需求为 $P = 5 - (Q_M + Q_N)/20$,$MC = 1.50$。

古诺均衡: \$Q_M^* = Q_N^* = 23.3\$ 杯。\$P = 2.67\$。玛雅的利润:\\$17.2/天(仅材料成本)。

施塔克尔伯格(玛雅为领导者): \$Q_M^S = 35\$,\$Q_N^S = 17.5\$。\$P = 2.375\$。玛雅的利润:\\$10.6/天——由于先行者优势略高。

内特进入市场后,玛雅的产量从45杯降至23.3杯,价格从\\$1.75降至\\$1.67。

结论

关键公式

标签方程描述
式 6.1$P = MC = AC_{min}$, $\Pi = 0$长期竞争均衡
式 6.2$\max \Pi = P(Q)Q - TC(Q)$垄断者的问题
式 6.3$MR = P + Q(dP/dQ)$边际收益
式 6.4$MR = MC$垄断利润最大化条件
式 6.5$(P-MC)/P = 1/|\varepsilon_d|$勒纳指数
式 6.6$MR_1 = MR_2 = MC$三级价格歧视
式 6.7–6.8最优反应函数古诺反应函数
式 6.9$q_i^C = (a-c)/(3b)$古诺对称均衡
式 6.10$P^C = (a+2c)/3$古诺价格
式 6.11$P^B = c$伯特兰均衡(同质产品)
式 6.12–6.13$q_1^S = (a-c)/(2b)$, $q_2^S = (a-c)/(4b)$施塔克尔伯格产量
式 6.14$u_i(s_i^*, s_{-i}^*) \geq u_i(s_i, s_{-i}^*)$ 对所有 $s_i$ 成立纳什均衡
Eq. 6.15$\delta \geq (\pi_D - \pi_C)/(\pi_D - \pi_N)$Cooperation threshold (grim trigger)

练习题

基础练习

  1. 一个垄断者面对 $P = 50 - Q$,$MC = 10$。求垄断价格、产量、利润和无谓损失。计算勒纳指数并验证它等于 $1/|\varepsilon_d|$。
  2. 一个垄断者在两个市场销售:$P_1 = 24 - Q_1$ 和 $P_2 = 16 - 2Q_2$,$MC = 4$。求每个市场的利润最大化价格和产量。哪个市场的需求弹性更大?
  3. 两个古诺双寡头面对 $P = 80 - Q$,$c_1 = c_2 = 8$。求:(a) 每家企业的产量,(b) 市场价格,(c) 每家企业的利润。将总行业产量和利润与垄断情形比较。
  4. 将练习3作为施塔克尔伯格博弈重做,企业1为领导者。
  5. 找出所有纯策略纳什均衡:
    B: XB: Y
    A: X(3, 3)(1, 4)
    A: Y(4, 1)(2, 2)
    这是囚徒困境吗?为什么?

应用练习

  1. 为什么伯特兰悖论不适用于可口可乐和百事可乐?指出真实软饮料市场的三个具体特征,说明为什么价格不会降至边际成本。
  2. 两个加油站位于十字路口的对角。它们销售相同的汽油并每天观察对方的价格。解释为什么伯特兰模型预测 $P = MC$,然后解释为什么实际中加油站能维持高于MC的价格。
  3. 一家制药公司持有某药品的专利(垄断)。当专利到期后,仿制药竞争者进入。使用完全竞争模型,预测以下变量的变化:价格、产量、生产者剩余、消费者剩余和无谓损失。专利制度是否有效?
  4. 考虑一个有一家在位企业和一家潜在进入者的市场。在位者可以设定"限制性价格"——使进入无利可图的低价——或高垄断价格。将此分析为序贯博弈。在什么条件下限制定价是可信的?

挑战题

  1. 推导需求为 $P = a - bQ$、边际成本为常数 $c$ 的 $n$ 家对称企业的古诺均衡。证明当 $n \to \infty$ 时,$P \to c$ 且结果趋向完全竞争。在 $n$ 为多少时,古诺价格达到竞争价格的10%以内?
  2. 在古诺双寡头中,企业考虑组建卡特尔。(a) 求卡特尔产量和利润。(b) 证明每家企业都有欺骗的激励。(c) 在以古诺回归为惩罚的无限重复博弈中,什么折现因子 $\delta$ 使合作可持续?
  3. 证明垄断者永远不会在需求曲线的非弹性部分运营。(提示:证明如果 $|\varepsilon_d| < 1$,垄断者可以通过减少产量来增加利润。)

你已完成第二部分 —— 微观

你现在可以评估:

  • 大科技是否是垄断问题
  • 超越简单供需的战略性贸易论据

你可以探索的大问题:

  • 大问题 #4:人是理性的吗?(现在你已经知道理性选择在形式上究竟要求什么)
  • 大问题 #5:自由贸易总是好的吗?(带着市场势力)

第三部分预告:宏观经济学把尺度从企业提升到国家。