Unif lection
第19章 行为与实验经济学
引言
本书中的每一个模型都假设了理性行为主体——最大化期望效用的消费者、最小化成本的企业、具有一致时间偏好和正确信念的交易者。这些假设很有力:它们产生了精确的预测、干净的福利定理和优雅的数学。但它们是正确的吗?
本章直面证据。行为经济学学学学学学学学记录了与标准理性模型的可预测、系统性偏差。这些不是在总量中被冲掉的随机误差——它们是在重复、激励甚至专业知识条件下仍然存在的模式化偏差。
我们从期望效用理论的裂缝开始——阿莱悖论和埃尔斯伯格悖论——并逐步构建前景理论,这是领先的描述性替代方案。然后我们考察现时偏好下的跨期选择、违反纯粹自利的社会偏好、有限理性和启发法、实验方法论、助推理论和行为金融学。全程的方法是正式的:我们写下效用函数、推导预测并对照数据检验。
学完本章后,你将能够:
将阿莱悖论和埃尔斯伯格悖论识别为期望效用公理的正式违反
阐述前景理论的价值函数和概率加权函数及其参数形式
使用准双曲(beta-delta)框架建模现时偏好并推导时间不一致性
在费尔-施密特不平等厌恶偏好下计算均衡结果
区分满意化与优化,并描述稀疏最大化的特征
评估实验设计选择——实验室与实地实验、需求效应、复制问题
将助推理论和选择架构应用于政策设计
解释为什么理性套利无法消除金融市场中的行为定价偏差
前置知识:期望效用理论(第6章)、博弈论(第7章)、消费者理论(第6/10章)、计量经济学基础(第9章)、机制设计基础(第11章)。
相关文献: Kahneman & Tversky(1979);Tversky & Kahneman(1992);Thaler(1980, 2015);Laibson(1997);Fehr & Schmidt(1999);Gabaix(2014);Shleifer & Vishny(1997);DeLong, Shleifer, Summers & Waldmann(1990)。
19.1 期望效用的违反
期望效用基准
回忆第6章,在完备性、传递性、连续性和独立性公理 下,对彩票的偏好可以用期望效用表示:
期望效用。 一种风险决策理论,行为主体选择使$EU(L) = \sum_{i=1}^{n} p_i \, u(x_i)$最大化的彩票$L$,其中$p_i$是客观概率,$x_i$是结果,$u(\cdot)$是定义在最终财富上的伯努利效用函数。EU是衡量所有行为偏差的基准。
$$EU(L) = \sum_{i=1}^{n} p_i \, u(x_i)$$
(Eq. 19.1)
独立性公理。 如果彩票$A$优于$B$,那么混合彩票$pA + (1-p)C$必须优于$pB + (1-p)C$,对于任何彩票$C$和任何概率$p \in (0,1)$。混入一个共同成分$C$不应逆转你对$A$和$B$的排序。阿莱悖论展示了对该公理的系统性违反。
独立性公理优雅且在规范意义上有吸引力。它说你对两个赌博的偏好不应受到无关共同成分的影响。但正如莫里斯·阿莱在1953年所展示的,大多数人类一致地违反它。
阿莱悖论(1953)
阿莱悖论。 实证发现(Allais,1953):大多数人偏好确定的\$100万而非期望值更高的风险赌博(确定性效应),但同时在两个选项都涉及不确定性时偏好风险更大的赌博。这些联合偏好违反了期望效用理论的独立性公理。
考虑两对彩票:
第1对: 赌博1A:确定得到\$100万。赌博1B:10%概率得\$500万,89%概率得\$100万,1%概率得\$0。
第2对: 赌博2A:11%概率得\$100万,89%概率得\$0。赌博2B:10%概率得\$500万,90%概率得\$0。
众数模式:大多数人在第1对中选择1A,在第2对中选择2B。联合选择$\{1A, 2B\}$违反了独立性公理。
共同结果效应。 独立性公理违反的一个特例,当一对选项中两者共享的共同结果被改变时偏好发生逆转。在阿莱悖论中,每对赌博中两者共享的0.89概率成分就是共同结果。
根据独立性公理,替换共同结果(第1对中的\$100万,第2对中的\$0)不应改变排序。如果$1A \succ 1B$,则$1A \succ 2B$。偏好逆转揭示了确定性效应 。
埃尔斯伯格悖论(1961)
埃尔斯伯格悖论。 实证发现(Ellsberg,1961):人们偏好已知概率的赌博而非未知(模糊)概率的赌博,即使EU理论预测无差异。这揭示了模糊厌恶。
考虑一个罐子,有30个红球和60个黑色或黄色球(比例未知)。赌博A:如果抽到红球赢\$100(概率1/3,已知)。赌博B:如果抽到黑球赢\$100(概率未知)。大多数人选A。
但接下来:赌博C:如果抽到红球或黄球赢\$100。赌博D:如果抽到黑球或黄球赢\$100。大多数人选D。在EU下,$A \succ B$要求$C \succ D$。联合选择$\{A, D\}$违反了确定性原则。
模糊厌恶。 偏好已知概率而非未知概率。模糊厌恶的行为主体偏好已知罐子中的50/50赌博,而非未知组成罐子中的等价赌博。这违反了主观期望效用理论基础的Savage公理。
这些悖论揭示独立性公理在描述上是失败的。我们需要一个能容纳这些违反的理论。
例19.1——阿莱悖论计算
题目。两组彩票对。假设CRRA效用函数u(x) = x^{0.5}(x以百万为单位)。(a) 计算每个赌局的期望效用。(b) 期望效用推荐哪个?(c) 证明{1A, 2B}的选择违反独立性公理。
解答。
(a) EU(1A) = 1.0 × 1^{0.5} = 1.000。EU(1B) = 0.89(1) + 0.10(2.236) + 0.01(0) = 1.1136。EU(2A) = 0.11(1) = 0.11。EU(2B) = 0.10(2.236) = 0.2236。
(b) 期望效用推荐1B(1.114 > 1.000)和2B(0.224 > 0.110)。与期望效用一致的组合:{1A, 2A}或{1B, 2B}。
(c) 1A ≻ 1B要求1.11 u(1) > 0.10 u(5) + 0.01 u(0)。1B ≻ 2A要求1.10 u(5) + 0.01 u(0) > 0.11 u(1)。这两个条件直接矛盾。没有u(·)能同时满足两者。
19.2 前景理论
从EU到前景理论
卡尼曼和特沃斯基(1979)提出了前景理论 作为描述性替代方案,后来精炼为累积前景理论(1992)。它在四个方面修改了EU:参考依赖、损失厌恶、敏感度递减和概率加权。
前景理论。 一种风险决策的描述性理论(Kahneman和Tversky,1979),通过四个关键修正取代期望效用:参考依赖、损失厌恶、敏感度递减(得利区凹、损失区凸)和概率加权。
价值函数
价值函数用定义在相对于参考点的得失上的$v(x)$取代了定义在最终财富上的$u(x)$:
价值函数(S形、有折角)。 前景理论中效用函数的对应物,定义在相对于参考点的偏差上,而非最终财富水平。它在得利区是凹的,在损失区是凸的,在参考点处显示折角,其中损失区的斜率超过得利区的斜率,倍数为损失厌恶系数$\lambda$。
$$v(x) = \begin{cases} x^{\alpha} & \text{if } x \geq 0 \\ -\lambda(-x)^{\beta} & \text{if } x < 0 \end{cases}$$
(Eq. 19.2)
特沃斯基和卡尼曼(1992)估计的参数为$\alpha = \beta = 0.88$,$\lambda = 2.25$。
三个性质:(1)参考依赖 ——结果被编码为相对于$r$的得利或损失。(2)敏感度递减 ——$\alpha, \beta < 1$使得利区凹、损失区凸。(3)损失厌恶 ——$\lambda > 1$使价值函数在损失区更陡峭。
损失厌恶。 实证发现:损失比等量的收益感觉更强烈:$|v(-x)| > v(x)$,$x > 0$。损失厌恶系数$\lambda \approx 2.25$意味着失去\$100的痛苦感约为获得\$100的快乐感的2.25倍。
参考依赖。 结果被评估为相对于参考点的得利或损失,而非最终财富状态。参考点通常是现状,但也可以是预期、愿望或社会比较。
Alpha(得利曲率):
Beta(损失曲率):
Lambda(损失厌恶):
概率加权函数
概率加权函数。 将客观概率转换为主观决策权重的函数$w(p)$。它高估小概率(小$p$时$w(p) > p$),低估中等至大概率,并满足$w(0)=0$,$w(1)=1$。
$$w(p) = \dfrac{p^{\delta}}{(p^{\delta} + (1-p)^{\delta})^{1/\delta}}$$
(Eq. 19.3)
特沃斯基-卡尼曼(1992)参数$\delta \approx 0.65$。当$\delta = 1$时,$w(p) = p$(EU)。当$\delta < 1$时,函数高估小概率,低估大概率。交叉点在$p \approx 0.37$。
Delta(T-K):
前景理论估值
$$V(L) = \sum_{i} w(p_i) \, v(x_i - r)$$
(Eq. 19.4)
注意: 这是原始前景理论表述(Kahneman & Tversky,1979),将决策权重应用于单个概率。累积前景理论(Tversky & Kahneman,1992)将决策权重应用于排序结果的累积概率,解决了某些异常现象,如随机占优的违反。
禀赋效应
禀赋效应。 一旦拥有某物,对其估值高于愿意为获取它所支付的价格的倾向。源于损失厌恶:放弃已拥有的物品被编码为损失。
风险态度的四重模式
风险态度的四重模式。 S形价值函数和概率加权的组合产生四种不同的风险态度:小概率得利时风险寻求,小概率损失时风险厌恶,大概率得利时风险厌恶,大概率损失时风险寻求。
四重模式:小$p$ + 得利 = 风险寻求(彩票);小$p$ + 损失 = 风险厌恶(保险);大$p$ + 得利 = 风险厌恶(确定性效应);大$p$ + 损失 = 风险寻求(孤注一掷)。
框架效应与心理账户
框架效应。 选择呈现方式(框架)影响决策的现象,即使客观结果完全相同。
心理账户。 将财务决策组织到独立"账户"中而非将财富视为可替代的认知过程。
例19.2——前景理论与EU估值比较
题目。一个赌局以0.5的概率获得+\$1,000,以0.5的概率损失\$800。参考点r = 0。(a) 在CRRA效用函数u(x) = x^{0.5}、初始财富W = \$10,000下的EU确定性等价。(b) 标准参数下的前景理论估值。(c) 为什么损失厌恶逆转了评估结果?
解答。
(a) EU = 0.5(11,000)^{0.5} + 0.5(9,200)^{0.5} = 0.5(104.88) + 0.5(95.92) = 100.40。CE:\$100.40^2 = 10,080$。CE变化 = +80.2。接受赌局。
(b) v(+1000) = 1000^{0.88} = 436.5。v(−800) = −2.25 × 800^{0.88} = −2.25 × 358.7 = −807.1。概率权重w(0.5) ≈ 0.439:V = 0.439(436.5) + 0.439(−807.1) = −162.6。拒绝赌局。
(c) 损失厌恶(λ = 2.25)使\$800的损失权重远大于\$1,000的收益,从而逆转了评估结果。
19.3 跨期选择与现时偏好
指数贴现基准
标准理论假设指数贴现,贴现因子$\delta \in (0,1)$。关键性质是时间一致性 :在$t=0$制定的计划在每个未来日期都保持最优。
双曲线贴现与准双曲线贴现
实验证据压倒性地拒绝了恒定贴现。人们表现出递减的不耐心 :今天与明天之间的贴现率远高于第100天与第101天之间。
双曲线贴现。 一种时间偏好模型,贴现函数取$D(t) = (1+kt)^{-1}$的形式,而非指数形式$\delta^t$。产生递减的贴现率和时间不一致的偏好。
准双曲线(beta-delta)贴现。 一种可处理的现时偏好模型(Laibson,1997),贴现函数为$\{1, \beta\delta, \beta\delta^2, \ldots\}$,$\beta \leq 1$。当$\beta = 1$时退化为指数贴现。
$$U_0 = u(c_0) + \beta \sum_{t=1}^{T} \delta^t \, u(c_t)$$
(Eq. 19.5)
准双曲线贴现因子为$\{1, \beta\delta, \beta\delta^2, \ldots\}$。即时时期获得权重1,但所有未来时期被额外乘以$\beta$。当$\beta < 1$时,"现在"和"未来"之间存在离散跳跃。
现时偏好。 相对于未来收益,给予即时收益不成比例的权重的倾向,超出指数贴现所暗示的程度。在beta-delta模型中由$\beta < 1$捕捉。
时间不一致性
$$\beta\delta u'(c_1) = u'(c_0) \neq \delta u'(c_1)$$
(Eq. 19.6)
在$t=0$时,关于$c_1$的一阶条件为$\beta\delta u'(c_1) = u'(c_0)$。在$t=1$时,重新优化给出$u'(c_1) = \beta\delta u'(c_2)$。$\beta$的位置已经转移——计划是时间不一致的。
天真型与成熟型行为主体
天真型行为主体。 一个有现时偏好但错误地认为未来的自己将像指数贴现者一样行为(未来$\beta=1$)的行为主体。永远在推迟代价高昂的行动。
成熟型行为主体。 一个有现时偏好且正确预见未来现时偏好的行为主体。使用逆向归纳法,可能寻求承诺机制。
承诺机制。 行为主体自愿采用以限制自己未来选择集的任何机制。例如:非流动性退休账户、截止日期承诺、自动工资扣除。
天真型行为主体 无限期地拖延。成熟型行为主体 使用逆向归纳法,可能采用承诺机制。
Beta(现时偏好):
Delta(耐心程度):
例19.3——Beta-Delta拖延
题目。一个学生必须完成一个项目。今天的成本 = 6效用单位,2期后的收益 = 10效用单位。β = 0.7,δ = 0.95,共5期。(a) 天真型代理人何时行动?(b) 成熟型代理人呢?
解答。
(a) 天真型:在每个t期,现在行动的净效用 = −6 + 0.7 × 0.95² × 10 = −6 + 6.32 = +0.32。等待的感知净效用 = 0.7 × 0.95 × (−6) + 0.7 × 0.95³ × 10 = −3.99 + 6.00 = +2.01。由于2.01 > 0.32,总是推迟。一直拖延到截止日。
(b) 成熟型:逆向归纳。在t = 2(最后可行时期),净效用 = +0.32 > 0,所以t=2的自我会行动。在t = 1:现在行动的净效用 = +0.32,等待t=2行动的净效用 = +2.01 > 0.32,所以等待。在t = 0:同理,等待。成熟型代理人在t = 2行动——比天真型的截止日更早。
例19.4——承诺机制的价值
题目。β = 0.7,δ = 0.95,对数效用,3期收入Y = 100的代理人。(a) 无承诺时的储蓄。(b) 有承诺时的储蓄。(c) 福利增益。
解答。
(a) 无承诺:t=0分配c₀ = 100/(1+0.665+0.632) = 43.54,余56.46。在t=1重新优化:c₁ = 56.46/1.665 = 33.91,c₂ = 22.55。
(b) 有承诺:c₁ = 0.665 × 100/2.297 = 28.95,c₂ = 0.632 × 100/2.297 = 27.51。
(c) 无承诺:U = 3.774 + 2.344 + 1.967 = 8.085。有承诺:U = 3.774 + 2.237 + 2.095 = 8.106。增益 = 0.020效用单位。有承诺的代理人实现了更平滑的消费路径。
19.4 社会偏好
超越自利
几十年的实验证据表明,人们系统性地偏离纯粹自利:拒绝不公平的出价、向陌生人给予、在一次性博弈中合作、惩罚搭便车者。
不平等厌恶。 一种偏好模型,行为主体厌恶不平等结果——无论是落后(嫉妒)还是领先(内疚)。费尔和施密特(1999)用嫉妒参数$\alpha$和内疚参数$\beta$将其形式化。
费尔-施密特效用函数
费尔-施密特效用。 一个通过减去不平等带来的负效用来修正自利收益的效用函数:$U_i = x_i - \alpha_i \max(x_j - x_i, 0) - \beta_i \max(x_i - x_j, 0)$。
$$U_i(x) = x_i - \alpha_i \max(x_j - x_i, 0) - \beta_i \max(x_i - x_j, 0)$$
(Eq. 19.7)
约束$\alpha_i \geq \beta_i$和$\beta_i < 1$是有实证动机的:嫉妒比内疚更伤人,没有人为了平等而销毁金钱。
最后通牒博弈
在最后通牒博弈中,最低可接受出价$s^*$满足$s - \alpha_R(100-2s) \geq 0$,得到$s^* = 100\alpha_R / (1+2\alpha_R)$。当$\alpha_R = 2$时:$s^* = 40$。
Alpha(嫉妒):
Beta(内疚):
独裁者博弈与公共品
在独裁者博弈中,平均分配为20-30%。在公共品博弈中,加入惩罚机制可维持合作。
例19.5——费尔-施密特最后通牒博弈
题目。\$100的最后通牒博弈。提议者:α_P = 0.5,β_P = 0.3。回应者:α_R = 2.0,β_R = 0.6。(a) 最低可接受报价。(b) 最优报价。(c) 与标准纳什均衡比较。
解答。
(a) U_R = s − 2.0(100−2s) = 5s − 200 ≥ 0 ⇒ s* = 40。
(b) U_P = (100−s) − 0.3(100−2s) = 70 − 0.4s,关于s递减。在s ≥ 40的约束下最小化s:最优报价s* = 40。U_P = 54,U_R = 0。
(c) 标准偏好(α = β = 0):报价\$1,被接受。费尔-施密特模型:报价\$40。更接近实验中40-50%的众数报价。
19.5 有限理性与启发法
西蒙的满意化
赫伯特·西蒙(1955)认为行为主体满意化 而非优化:搜索直到找到可接受的选项,然后停止。
满意化。 一种决策程序(Simon,1955),行为主体设定一个期望水平并选择第一个达到该水平的选项,而非比较所有替代方案。
有限理性。 认识到(Simon,1955)人类决策受到认知局限的制约——有限的记忆、有限的注意力和计算成本。
启发法与偏差
特沃斯基和卡尼曼(1974)识别了三种核心启发法:代表性 (通过相似性判断概率)、可得性 (通过回忆的容易程度估计频率)和锚定 (从初始值开始调整不充分)。
加贝的稀疏最大化
稀疏最大化。 一种有限理性模型(Gabaix,2014),行为主体最大化效用减去注意力成本。行为主体最优地分配注意力,对重要的维度给予更多关注。
$$\max_{\mathbf{c}} \, u(\mathbf{c}) - \theta \|\mathbf{m}\|_1 \quad \text{s.t. } \mathbf{p} \cdot \mathbf{c} \leq w$$
(Eq. 19.8)
加贝(2014)将有限理性形式化为一个优化问题:行为主体最大化效用减去每个维度的注意力成本$\theta$。行为主体感知$\hat{p}_k = \bar{p}_k + m_k(p_k - \bar{p}_k)$。
19.6 实验设计与方法论
实验室实验
实验室实验具有真实货币激励、随机化和控制。优势:内部有效性 。劣势:外部有效性 。
实地实验
实地实验将操控嵌入真实世界情境:自然行为、无意识、大规模。权衡:以较少的控制换取更大的现实性。
方法论挑战
需求效应: 被试可能因为知道自己被观察或推测实验者意图而改变行为。欺骗争论: 经济学有严格的反对欺骗的规范,不同于心理学。
复制危机 :只有36%的心理学研究被复制(开放科学合作,2015);经济学更高(约60%)但仍令人担忧。预注册 解决p-hacking和发表偏差问题。
19.7 助推理论与自由主义温和家长制
选择架构
如果选择取决于框架和默认设置,那么选择架构 ——选择呈现的方式——就很重要。
选择架构。 人们做决策的环境设计,包括选项顺序、默认设置、信息展示和物理安排。
助推。 选择架构中的任何方面,在不禁止选项或显著改变经济激励的情况下可预测地改变行为(Thaler和Sunstein,2008)。
自由主义温和家长制。 一种保持选择自由的同时通过助推而非强制命令引导选择朝向福利改善结果的哲学。
默认效应
默认效应。 坚持预先选定选项的不成比例的倾向,即使切换很容易且无成本。
最强大的助推是默认设置 。器官捐献:主动加入国家为15-20%,自动加入国家为85-99%。退休储蓄参与率从约50%(主动加入)跳升到超过90%(自动加入)。
$$P_{\text{enroll}} = \Phi\!\left(\frac{v - k \cdot (1-d)}{\sigma}\right)$$
(Eq. 19.9)
主动加入($d=0$)下:$P = \Phi((v-k)/\sigma)$。自动加入($d=1$)下:$P = \Phi(v/\sigma)$。当$v$为正但适中且$k/\sigma$不可忽略时,差距最大。
转换成本(k):
EAST框架
EAST框架。 助推设计的实用指南:使期望行为简便 、吸引 、社交 和适时 。
EAST框架:简便 (减少摩擦)、吸引 (使之突出)、社交 (利用规范)、适时 (在接受度高的时刻提示)。
阻力
阻力。 有意或无意添加到流程中的摩擦,阻碍期望行为。助推的反面。
阻力 是阻碍期望行为的摩擦。减少阻力通常与引入新的助推一样有效。
行为福利经济学
Bernheim和Rangel(2009):基于不受行为扭曲影响的选择评估福利——当行为主体信息充分、注意力集中且不受扭曲时。
观点
'Libertarian paternalism is just paternalism with better PR' — Gilles Saint-Paul, The Tyranny of Utility
When Thaler and Sunstein published Nudge in 2008, it seemed like a policy cheat code: redesign defaults and people save more, eat better, donate organs — all without restricting choice. Governments loved it. The UK created a "Nudge Unit," and Obama hired Sunstein as regulatory czar. But the backlash was fierce. Gilles Saint-Paul called it "the tyranny of utility" — technocrats deciding what's good for you while pretending to respect your freedom. Op-eds called nudging "manipulation by the state." Is libertarian paternalism a brilliant synthesis, or a contradiction in terms?
高级
阅读分析 →
流行版本
Saint-Paul的"效用暴政"框定在流行版本中更像口号而非论证。把助推称为"国家操纵"的病毒式社论把助推与强制混为一谈——助推按定义保留了不同选择的选项。改变你401(k)登记的默认选项与强迫你储蓄不同。
另一边,欢快的亲助推版本——"只要改变默认,轻松胜出,人人受益,有什么问题?"——忽视了关于自主权和谁来设计选择架构的深层哲学问题。"操纵!"阵营和"免费午餐!"阵营在论证上都很糟。
Saint-Paul的实际书远更严肃:它是关于一个声称比你更了解你的偏好的政府的认识论问题。真正的智识张力在于偏好本身的性质,而非选择退出表格的机制。
On the other side, the cheerful pro-nudge version — "just change the default, easy wins, everyone benefits, what's the problem?" — ignores the deep philosophical questions about autonomy and who gets to design the choice architecture. Both the "manipulation!" crowd and the "free lunch!" crowd are bad at the argument.
Saint-Paul's actual book is far more serious: it is about the epistemic problem of a government that claims to know your preferences better than you do. The real intellectual tension is about the nature of preferences themselves, not the mechanics of opt-out forms.
最强支持论点
如果Saint-Paul把他的论证推到最尖锐形式,他会做三步移动。第一,循环性问题: 人们"犯错"的主张需要一个正确性标准——而那个标准正是由提出助推的同一批行为经济学学学学学学学学家定义的。我们知道人们非理性是因为他们没选我们认为他们应该选的,而我们应当助推他们是因为他们非理性。谁的偏好算数——选择芝士汉堡的那个自我,还是后来后悔的那个自我?
第二,棘轮: 一旦"人们系统性非理性"被接受为前提,干预的理由就没有自然的停止点。英国的行为洞察团队从默认切换开始,进展到罪恶税和广告禁令——滑坡不是假设。第三,自主权成本: 即使一次助推按某种福利度量产生了"更好"的结果,它也可能破坏使人生值得活的自我创作。做次优选择并从中学习是作为自由主体的一部分。
Saint-Paul最深的观点:如果你认真对待行为经济学学学学学学学学,逻辑终点不是温和助推而是硬家长主义——而Thaler和Sunstein要么对他们前提指向何处不诚实,要么没想清楚。
Second, the ratchet: once "people are systematically irrational" is accepted as a premise, the case for intervention has no natural stopping point. The UK's Behavioural Insights Team started with default-switching and progressed to sin taxes and advertising bans — the slippery slope is not hypothetical. Third, the autonomy cost: even if a nudge produces a "better" outcome by some welfare measure, it may undermine the self-authorship that makes a life worth living. Making a suboptimal choice and learning from it is part of being a free agent.
Saint-Paul's deepest point: if you take behavioral economics seriously, the logical endpoint is not gentle nudging but hard paternalism — and Thaler and Sunstein are either being dishonest about where their premises lead, or they haven't thought it through.
最强反对论点
对Saint-Paul的反驳毁灭性地简单:选择架构无可逃脱。总得有人设定默认——退休储蓄是选择加入还是选择退出,食堂里沙拉还是薯条在视平线位置,器官捐献要求主动登记还是主动拒绝。没有中性设计。
如果默认无论如何都会存在,那么根据关于人们实际想要什么的证据——由其陈述偏好、后悔模式以及在认知偏差被移除时的行为揭示——来设定它们,比让它们被任意或由追逐利润的私人主体设定更好。结果不言自明:自动401(k)登记使美国退休储蓄参与率从约60%提高到90%以上。欧洲国家的选择退出器官捐献产生的捐献率是选择加入系统的2–4倍。这些是人们压倒性地偏爱助推结果但因惯性和现状偏差而未能行动的情形。
政府已经通过税收、规制和补贴塑造行为。助推是政策工具箱中最不 强制的工具。Saint-Paul的批评证明得过了头:如果助推是"暴政",那么每一个默认、菜单布局和表格设计的选择也是。有意选择架构的替代方案不是自由——而是服务于其设计者的无意选择架构。
If defaults are going to exist regardless, it is better to set them based on evidence about what people actually want — as revealed by their stated preferences, their regret patterns, and their behavior when cognitive biases are removed — than to let them be set arbitrarily or by profit-motivated private actors. The results speak for themselves: automatic 401(k) enrollment increased US retirement savings participation from roughly 60% to over 90%. Opt-out organ donation in European countries produces donation rates 2–4 times higher than opt-in systems. These are cases where people overwhelmingly prefer the nudged outcome but fail to act due to inertia and status quo bias.
The government already shapes behavior through taxes, regulations, and subsidies. Nudges are the least coercive tool in the policy toolkit. Saint-Paul's critique proves too much: if nudging is "tyranny," then so is every choice of default, menu layout, and form design. The alternative to intentional choice architecture is not freedom — it is unintentional choice architecture that serves whoever designed it.
判断
那么Saint-Paul说对了吗——自由意志主义家长主义是有更好公关的家长主义?部分——而部分真相是重要的部分。助推对一类狭窄的问题是正当的:(a) 存在一个清晰、可测量的结果,人们压倒性地偏爱却因充分记录的认知偏差而未能实现;(b) 助推保留容易的选择退出;(c) 选择可逆。退休储蓄默认和器官捐献满足所有三个标准。
但Saint-Paul的棘轮批评有牙齿:英国助推单位确实扩大了职权,"系统性非理性"作为前提确实没有自然边界。最深的讽刺是Saint-Paul识别出但未完全解决的:如果人们系统性地不善于评估自己的利益,他们为什么善于评估一次助推是否违背其利益?认真看待行为经济学学学学学学学学的内在逻辑指向硬家长主义,而非温和的那种。Thaler和Sunstein画了一条他们自己理论不支持的线。
自由意志主义家长主义作为特定、定义良好问题的政策工具起作用。作为治理哲学,它不自洽——而Saint-Paul,尽管有论战性的过度,精确地识别出了为什么。
But Saint-Paul's ratchet critique has teeth: the UK's Nudge Unit did expand its mandate, and "systematic irrationality" as a premise genuinely has no natural boundary. The deepest irony is the one Saint-Paul identifies but doesn't quite resolve: if people are systematically bad at assessing their own interests, why would they be good at assessing whether a nudge is against their interests? The internal logic of behavioral economics, taken seriously, points toward hard paternalism, not the gentle kind. Thaler and Sunstein draw a line that their own theory does not support.
Libertarian paternalism works as a policy tool for specific, well-defined problems. As a philosophy of governance, it is incoherent — and Saint-Paul, for all his polemic excess, identified exactly why.
19.8 行为金融学
市场有效性及其挑战者
有效市场假说认为价格完全反映了所有信息。行为金融学对此提出挑战:许多交易者不是理性的,而理性套利者面临限制。
过度自信与过度交易
过度自信产生过度交易。巴伯和奥丁(2000):最活跃的交易者每年比最不活跃的少赚6.5个百分点。
处置效应
处置效应。 过早卖出盈利资产并过长持有亏损资产的倾向。源于前景理论:得利处于凹的(风险厌恶)区域,损失处于凸的(风险寻求)区域。
参考点是购买价格。得利处于凹区域(风险厌恶,提早卖出);损失处于凸区域(风险寻求,持有)。
动量与反转异象
股票在3-12个月内表现优异(动量,Jegadeesh-Titman 1993),在3-5年内表现不佳(反转,DeBondt-Thaler 1985)。
套利限制
套利限制。 理性套利者无法完全消除定价偏差的条件:基本面风险、噪声交易者风险、执行成本和委托代理问题。
噪声交易者。 基于情绪而非基本面分析进行交易的投资者。引入不可预测的价格扭曲。在DSSW模型中,噪声交易者可以存活甚至获利。
即使理性交易者也可能无法纠正定价偏差:噪声交易者风险、执行成本和委托代理问题制约了他们。
DSSW噪声交易者模型
$$p_t = f_t + \frac{\gamma \, \rho_t \, \mu_t}{1+r}$$
(Eq. 19.10)
德龙、施莱弗、萨默斯和瓦尔德曼(1990):更高的$\mu$使价格偏离基本面;更高的$\rho$放大偏差;更高的$\gamma$(套利者风险厌恶度)意味着对定价偏差的交易更不激进,因此偏差增大。
悖论:噪声交易者可以通过承担他们自己制造的风险而获得更高的预期收益。
噪声交易者情绪(mu):
噪声交易者占比(rho):
套利者风险厌恶度(gamma):
例19.6——噪声交易者定价
题目。f = 100,ρ = 0.30,μ = 20(看涨),r = 0.05,γ = 2。(a) 计算均衡价格。(b) 价格偏差。(c) 若γ = 0会怎样?
解答。
(a) p = 100 + (2 × 0.30 × 20)/1.05 = 100 + 12/1.05 = 100 + 11.43 = 111.43。
(b) 偏差:p − f = 11.43。资产被高估,因为噪声交易者将价格推高至基本面之上,而风险厌恶的套利者无法完全抵消。
(c) 若γ = 0:p = 100 + 0 = 100。风险中性的套利者交易力度足以完全消除错误定价。DSSW模型的关键洞见:正是套利者的风险厌恶(γ > 0)使得噪声交易者驱动的偏差得以持续。
模型的解释
行为案例现在已完全组装。前景理论(Kahneman & Tversky 1979)为期望效用提供了形式化、可检验的替代方案:人们相对于参考点评估结果,损失厌恶($\lambda \approx 2.25$),对小概率赋予过重权重。当下偏见($\beta\delta$ 折现,Laibson 1997)解释拖延、储蓄不足和时间不一致性——人们对即将到来的未来折现远重于遥远的未来。社会偏好(Fehr-Schmidt不平等厌恶)解释了纯自利预测背叛的情境中的合作与惩罚。有限理性(Gabaix稀疏最大化)形式化了注意力稀缺、人们对世界的简化模型进行优化的观念。这些不是孤立轶事——它们系统、可复制,且在高赌注下依然存活。第二站(第11章)中记录的对理性公理的违反现在拥有比期望效用理论更好地拟合数据的形式化替代模型。
最强的反驳
两个有力的反驳在行为猛攻中存活下来。第一,生态理性 (Gigerenzer):启发式不是偏差——它们是对时间和信息有限的真实世界环境的高效适应。"快速节俭"启发式在数据嘈杂的现实场景中往往优于完全最优化。记录"偏差"的实验室结果可能是剥离了人类认知在其中演化得以良好运作的生态背景的人工环境的假象。如果环境足够不确定,忽略信息可以是最优的 ,而非非理性。第二,市场纪律 :即使个体有偏差,竞争市场也可能聚合消除个体错误。由非理性管理者经营的企业被竞争淘汰。系统性多付的消费者被经验教育。"仿佛"辩护——无论他们脑子里发生什么,市场都表现得仿佛主体是理性的——仍是一个严肃立场,尤其对于进入容易、反馈快速的竞争产品市场。
主流的回应
行为金融提供了关键检验——而"仿佛"辩护在其本应最强的市场中失败了。DSSW噪声交易者模型(1990)表明非理性交易者可以存活并移动价格,因为套利有风险且有限。Shleifer和Vishny(1997)确立了"套利的限制":即使复杂的套利者也面临做空成本、追加保证金和职业风险——他们无法完全纠正由噪声交易者造成的错误定价。股权溢价之谜、过度波动和动量异象尽管经过数十年复杂套利依然持续。如果偏差在金融市场中存活——信息传播最快、赌注最高、最聪明的资本竞争的地方——"仿佛"辩护就不可能是一般原则。主流吸收了行为经济学学学学学学学学,不是通过拒绝理性选择,而是通过丰富它:前景理论现在是金融学中的标准,$\beta\delta$ 偏好在宏观中是标准,机制设计越来越多地包含行为主体。
判断(在当前水平)
按公理要求人们并非完全理性——证据压倒性,不再有严肃争议。更重要的问题是它对聚合结果是否重要,而答案是领域特定的。在金融市场:是的,偏差存活并移动价格,因为套利的限制真实且持久。在消费市场:有时——默认和框架对退休储蓄、器官捐献和能源使用有巨大、持久的效应。在竞争产品市场:不太清楚——竞争、进入和经验可能随时间纪律化许多偏差。诚实的解答是"人是理性的吗?"一直是错误的问题。理性不是二元的。正确的问题是:非理性何时对聚合结果重要,何时市场机制把它洗掉? 答案取决于具体市场、具体偏差和具体制度背景。行为经济学学学学学学学学没有推翻理性选择——它绘制了理性选择何处起作用、何处崩溃,以及用什么替代的地图。
目前无法解决的问题
这是大问题 #4 的最后一站。这段弧线从理性假设作为建模工具(第1章)开始,经过其形式化和可检验公理(第11章),到完整的行为挑战及其市场检验(此处)。最艰难的未决问题是关于政策的:如果人们有偏差,政府是否应当纠正他们的选择?助推理论说是的,温和地——自由意志主义家长主义。但前提(系统性非理性)可能破坏结论(可以信任人们会选择退出)。"谁助推助推者?"的问题没有干净的答案——政府监管者自身也受他们试图纠正的同样偏差的支配。前沿继续移动:神经经济学、有限理性的计算模型和机器学习偏好估计方法正在重塑21世纪"理性"的含义。
相关观点
观点
'Libertarian paternalism is just paternalism with better PR' — Gilles Saint-Paul, The Tyranny of Utility
助推起作用。但谁决定"更好"意味着什么,干预在哪里停止?行为经济学学学学学学学学的内在逻辑指向硬家长主义,而非温和的那种。
高级
观点
如果人们不是理性的,市场怎么还能运转?
Dan Riffle在2019年普及了这个口号。福利定理说竞争均衡是有效率的——但许多亿万富翁的财富来自市场势力,而非竞争。行为经济学学学学学学学学增加了另一层:公平规范塑造人们所容忍的东西。
高级
经典问题 #4
人是理性的吗?
大问题 #4 得出裁决——偏差是真实的,但它们在市场中存活吗?前景理论、当下偏见和噪声交易者给出答案:理性是一个光谱,问题一直是错的。不是"他们是否理性",而是"非理性何时对聚合结果重要?"
探索这个问题 →
主线案例:玛雅的企业
玛雅在夏季促销中为每杯柠檬水附赠一块免费饼干。销量适度增加——上升了8%。当玛雅取消免费饼干(恢复原价)时,顾客的反弹不成比例:投诉、差评、流失常客。销量下降15%——低于 促销前的基准水平。
前景理论分析。 促销期间,顾客的参考点从"柠檬水"转移到了"柠檬水+饼干"。添加饼干的收益为$v(+\text{cookie}) = (\text{cookie\_value})^{0.88}$。但移除饼干的损失为$v(-\text{cookie}) = -2.25 \times (\text{cookie\_value})^{0.88}$。感知到的损失是原始收益的2.25倍。促销是一个单向棘轮:给容易,收回痛苦。
玛雅设计助推实验。 对于她的会员计划,玛雅将两种注册设计作为实地实验进行测试:处理A(主动加入) :顾客可以在柜台报名。处理B(自动加入) :每位顾客自动获得一张卡;可以选择退出。使用Eq. 19.9,$v = 3$,$\sigma = 2$,$k = 2$:主动加入$P = \Phi(0.5) = 0.69$;自动加入$P = \Phi(1.5) = 0.93$。玛雅的实地实验证实了预测。她将全面推广改为自动加入。
历史视角
卡尼曼和特沃斯基(1979)。 "前景理论:风险决策分析"是经济学中被引用最多的论文之一。发表于Econometrica ,它将实验发现形式化为一个连贯的数学框架。卡尼曼在2002年获得诺贝尔奖;特沃斯基于1996年去世。
莫里斯·阿莱(1953)。 这位法国经济学家直接向Leonard Savage展示了他的悖论。传说Savage本人也落入了阿莱模式。阿莱在1988年获得诺贝尔奖。
理查德·塞勒(2017年诺贝尔奖)。 塞勒的"异常现象"专栏系统地编目了行为偏差。他2008年与Sunstein合著的Nudge 将行为洞见带入政策领域,引发了全球的"助推小组"。
大卫·莱布森(1997)。 "金蛋与双曲线贴现"将beta-delta模型形式化,解释了为什么人们同时持有18%利率的信用卡债务和5%利率的非流动性储蓄。
施莱弗和维什尼(1997)。 "套利的限制"展示了为什么当理性交易者管理他人资金并面临资本约束时无法消除定价偏差。
结论
期望效用的违反。 阿莱悖论(确定性效应)和埃尔斯伯格悖论(模糊厌恶)表明EU公理在描述上是失败的。
前景理论。 卡尼曼和特沃斯基的替代方案以参考依赖、损失厌恶($\lambda \approx 2.25$)、敏感度递减和概率加权为特征。四重模式解释了同时购买彩票和保险的行为。
现时偏好。 准双曲模型($\beta < 1$)捕捉对即时收益不成比例的权重,产生时间不一致性、拖延行为和对承诺机制的需求。
社会偏好。 费尔-施密特不平等厌恶解释了拒绝不公平出价、独裁者博弈中的正向给予和有条件合作。
有限理性。 启发法(代表性、可得性、锚定)产生系统性偏差。加贝的稀疏最大化将有限理性形式化为最优注意力分配。
实验方法论。 实验室实验提供内部有效性;实地实验提供外部有效性。复制危机推动了预注册和更严格的标准。
助推理论。 选择架构不可避免;自由主义温和家长制利用默认设置、框架和简化来改善福利,同时不限制选择。EAST框架将此操作化。
行为金融学。 过度自信驱动过度交易。处置效应源于前景理论。套利限制(施莱弗-维什尼)和噪声交易者风险(DSSW)解释了为什么定价偏差持续存在。
关键公式
标签 方程 描述
公式 19.1 $EU(L) = \sum p_i u(x_i)$ 期望效用
公式 19.2 $v(x) = x^\alpha$ (gains), $-\lambda(-x)^\beta$ (losses) 前景理论价值函数
公式 19.3 $w(p) = p^\delta / (p^\delta + (1-p)^\delta)^{1/\delta}$ 特沃斯基-卡尼曼概率加权
公式 19.4 $V(L) = \sum w(p_i) v(x_i - r)$ 前景理论估值
公式 19.5 $U_0 = u(c_0) + \beta \sum \delta^t u(c_t)$ 准双曲线贴现
公式 19.6 $\beta\delta u'(c_1) = u'(c_0) \neq \delta u'(c_1)$ 时间不一致性
公式 19.7 $U_i = x_i - \alpha_i \max(x_j-x_i,0) - \beta_i \max(x_i-x_j,0)$ 费尔-施密特不平等厌恶
公式 19.8 $\max u(c) - \theta\|m\|_1$ s.t. $p \cdot c \leq w$ 加贝稀疏最大化
公式 19.9 $P_{\text{enroll}} = \Phi((v - k(1-d))/\sigma)$ 默认敏感型注册
公式 19.10 $p_t = f_t + \gamma \rho_t \mu_t / (1+r)$ DSSW噪声交易者定价
基础练习
一个彩票以0.6的概率支付$+\$500$,以0.4的概率支付$-\$300$。分别在以下条件下计算估值:(a) 期望效用,$u(x) = \ln(W+x)$,$W = 10{,}000$;(b) 前景理论,$\alpha = \beta = 0.88$,$\lambda = 2.25$,$\delta = 0.65$。在每种模型下行为主体是否接受?
用代数证明阿莱悖论中的选择模式$\{1A, 2B\}$违反了独立性公理。用一般$u(\cdot)$写出每个赌博的期望效用,并证明没有任何$u$能合理化两个偏好。
一个行为主体有$\beta = 0.8$,$\delta = 0.90$。比较在$t = 3$时收到\$100在以下条件下的现值折现:(a) beta-delta模型;(b) 指数贴现。现时偏好降低了感知价值的百分比是多少?
在\$200的最后通牒博弈中,回应者有$\alpha_R = 1.5$,$\beta_R = 0.4$。计算最低可接受出价$s^*$。这占总额的多少比例?
应用练习
使用前景理论解释为什么同一个人既买彩票又买保险(四重模式)。计算以下的主观估值:(a) 以万分之一概率赢\$50,000的\$5彩票;(b) 以万分之一概率损失\$500,000时每年\$200的保险。使用标准参数。
一个有现时偏好的学生($\beta = 0.6$,$\delta = 0.95$)有三份作业分别在第1、2、3天截止。每份花费4效用并产生8效用。使用逆向归纳法确定成熟型行为主体的工作安排。与天真型行为主体比较。
使用Eq. 19.9计算主动加入与自动加入的注册率,$v=2$,$\sigma=3$,$k=4$。注册差距是多少?如果有5,000名员工,转为自动加入将增加多少注册?
在DSSW模型中,$f = 50$,$\rho = 0.20$,$\mu = 10$,$r = 0.04$:分别为$\gamma = 1$、$\gamma = 3$、$\gamma = 10$计算均衡价格。随着风险厌恶度增加,偏差如何变化?
挑战题
使用前景理论推导处置效应。投资者以$P_0 = 50$买入。股票价格为$P_1 = 70$(盈利)或$P_1 = 30$(亏损)。每种情况下可以等概率上涨或下跌\$10。分别计算卖出与持有的效用。证明投资者卖出盈利股并持有亏损股。
一个规划者考虑强制承诺(非流动性储蓄锁定收入的20%)。人口:60%的$\beta = 1$,40%的$\beta = 0.6$。所有人$\delta = 0.95$,对数效用。(a) 每种类型的福利变化。(b) 何时强制措施降低总体福利?(c) 为什么主动选择可能更优?
将加贝稀疏最大化应用于$n=3$种商品,$p_1 = 10$,$p_2 = 10.50$,$p_3 = 50$,默认$\bar{p} = 10$,$\theta = 0.5$,Cobb-Douglas效用,财富$w = 100$。(a) 哪些维度获得注意?(b) 完全注意与稀疏注意下的需求。(c) 为什么消费者在商品3上过度支出?
证明DSSW噪声交易者可以获得比套利者更高的预期收益。在均值误感知$\mu > 0$和方差$\sigma_\mu^2$下:(a) 推导预期超额收益;(b) 证明噪声交易者跑赢的条件;(c) 解释这个悖论。
Big Questions
Topics
Atlases
Takes