Skip to content

Commit 1822c97

Browse files
committed
update q learning job search
1 parent 9064ac1 commit 1822c97

14 files changed

+289
-302
lines changed

lectures/aiyagari.md

Lines changed: 8 additions & 8 deletions
Original file line numberDiff line numberDiff line change
@@ -169,9 +169,9 @@ w(r) = A (1 - \alpha) (A \alpha / (r + \delta))^{\alpha / (1 - \alpha)}
169169
* 价格诱导的行为产生的总量与价格一致
170170
* 总量和价格随时间保持不变
171171

172-
更详细地说,SREE列出了价格、储蓄和生产政策的集合,使得:
172+
更详细地说,SREE列出了价格、储蓄和生产策略的集合,使得:
173173

174-
* 家庭在给定价格下选择指定的储蓄政策
174+
* 家庭在给定价格下选择指定的储蓄策略
175175
* 企业在相同价格下最大化利润
176176
* 产生的总量与价格一致;特别是,资本需求等于供给
177177
* 总量(定义为横截面平均值)保持不变
@@ -180,8 +180,8 @@ w(r) = A (1 - \alpha) (A \alpha / (r + \delta))^{\alpha / (1 - \alpha)}
180180

181181
1. 选择一个提议的总资本量 $K$
182182
2. 确定相应的价格,其中利率 $r$ 由 {eq}`aiy_rgk` 决定,工资率 $w(r)$ 由 {eq}`aiy_wgr` 给出
183-
3. 确定给定这些价格下家庭的共同最优储蓄政策
184-
4. 计算给定这个储蓄政策下的稳态资本平均值
183+
3. 确定给定这些价格下家庭的共同最优储蓄策略
184+
4. 计算给定这个储蓄策略下的稳态资本平均值
185185

186186
如果最终数量与 $K$ 一致,那么我们就得到了一个SREE。
187187

@@ -214,7 +214,7 @@ w(r) = A (1 - \alpha) (A \alpha / (r + \delta))^{\alpha / (1 - \alpha)}
214214
class Household:
215215
"""
216216
这个类接收定义家庭资产积累问题的参数,并计算相应的回报和转移矩阵R
217-
和Q,这些矩阵是生成DiscreteDP实例所必需的,从而求解最优政策
217+
和Q,这些矩阵是生成DiscreteDP实例所必需的,从而求解最优策略
218218
219219
关于索引的说明:我们需要将状态空间S枚举为序列S = {0, ..., n}。
220220
为此,(a_i, z_i)索引对根据以下规则映射到s_i索引:
@@ -313,7 +313,7 @@ def asset_marginal(s_probs, a_size, z_size):
313313
return a_probs
314314
```
315315

316-
作为第一个例子,让我们计算并绘制在固定价格下的最优积累政策
316+
作为第一个例子,让我们计算并绘制在固定价格下的最优积累策略
317317

318318
```{code-cell} python3
319319
# 示例价格
@@ -353,7 +353,7 @@ ax.legend(loc='upper left')
353353
plt.show()
354354
```
355355

356-
该图显示了在不同外生状态值下的资产积累政策
356+
该图显示了在不同外生状态值下的资产积累策略
357357

358358
现在我们要计算均衡。
359359

@@ -399,7 +399,7 @@ def prices_to_capital_stock(am, r):
399399
w = r_to_w(r)
400400
am.set_prices(r, w)
401401
aiyagari_ddp = DiscreteDP(am.R, am.Q, β)
402-
# 计算最优政策
402+
# 计算最优策略
403403
results = aiyagari_ddp.solve(method='policy_iteration')
404404
# 计算稳态分布
405405
stationary_probs = results.mc.stationary_distributions[0]

lectures/career.md

Lines changed: 16 additions & 16 deletions
Original file line numberDiff line numberDiff line change
@@ -18,7 +18,7 @@ kernelspec:
1818
</div>
1919
```
2020

21-
# 工作搜寻 V:职业选择建模
21+
# 求职搜索 V:职业选择建模
2222

2323
```{index} single: Modeling; Career Choice
2424
```
@@ -73,13 +73,13 @@ from matplotlib import cm
7373
* *职业*被理解为包含许多可能工作的一般领域,而
7474
* *工作*被理解为在特定公司的一个职位
7575

76-
对于工人来说,工资可以分解为工作和职业的贡献
76+
对于劳动者来说,工资可以分解为工作和职业的贡献
7777

7878
* $w_t = \theta_t + \epsilon_t$,其中
7979
* $\theta_t$ 是在时间 t 职业的贡献
8080
* $\epsilon_t$ 是在时间 t 工作的贡献
8181

82-
在时间 t 开始时,工人有以下选择
82+
在时间 t 开始时,劳动者有以下选择
8383

8484
* 保持当前的(职业,工作)组合 $(\theta_t, \epsilon_t)$
8585
--- 以下简称为"原地不动"
@@ -93,9 +93,9 @@ $\theta$ 和 $\epsilon$ 的抽取彼此独立,且与过去的值无关,其
9393
* $\theta_t \sim F$
9494
* $\epsilon_t \sim G$
9595

96-
注意,工人没有保留工作但重新选择职业的选项 --- 开始新职业总是需要开始新工作。
96+
注意,劳动者没有保留工作但重新选择职业的选项 --- 开始新职业总是需要开始新工作。
9797

98-
年轻工人的目标是最大化折现工资的预期总和
98+
年轻劳动者的目标是最大化折现工资的预期总和
9999

100100
```{math}
101101
:label: exw
@@ -330,14 +330,14 @@ plt.show()
330330
```
331331
解释:
332332

333-
* 如果工作和职业都很差或一般,工人会尝试新的工作和新的职业
334-
* 如果职业足够好,工人会保持这个职业,并尝试新的工作直到找到一个足够好的工作。
335-
* 如果工作和职业都很好,工人会保持现状
333+
* 如果工作和职业都很差或一般,劳动者会尝试新的工作和新的职业
334+
* 如果职业足够好,劳动者会保持这个职业,并尝试新的工作直到找到一个足够好的工作。
335+
* 如果工作和职业都很好,劳动者会保持现状
336336

337-
注意,工人总是会保持一个足够好的职业,但不一定会保持即使是最高薪的工作。
337+
注意,劳动者总是会保持一个足够好的职业,但不一定会保持即使是最高薪的工作。
338338

339339
原因是高终身工资需要这两个变量都很大,而且
340-
工人不能在不换工作的情况下换职业
340+
劳动者不能在不换工作的情况下换职业
341341

342342
* 有时必须牺牲一个好工作来转向一个更好的职业。
343343

@@ -348,7 +348,7 @@ plt.show()
348348
```
349349

350350
使用 `CareerWorkerProblem` 类中的默认参数设置,
351-
当工人遵循最优策略时,生成并绘制 $\theta$ 和 $\epsilon$ 的典型样本路径。
351+
当劳动者遵循最优策略时,生成并绘制 $\theta$ 和 $\epsilon$ 的典型样本路径。
352352
特别是,除了随机性之外,复现以下图形(其中横轴表示时间)
353353

354354
```{figure} /_static/lecture_specific/career/career_solutions_ex1_py.png
@@ -412,15 +412,15 @@ plt.show()
412412
```{exercise}
413413
:label: career_ex2
414414
415-
现在让我们考虑从起点$(\theta, \epsilon) = (0, 0)$开始,工人需要多长时间才能找到一份永久性工作
415+
现在让我们考虑从起点$(\theta, \epsilon) = (0, 0)$开始,劳动者需要多长时间才能找到一份永久性工作
416416
417417
换句话说,我们要研究这个随机变量的分布
418418
419419
$$
420-
T^* := \text{工人的工作不再改变的第一个时间点}
420+
T^* := \text{劳动者的工作不再改变的第一个时间点}
421421
$$
422422
423-
显然,当且仅当$(\theta_t, \epsilon_t)$进入$(\theta, \epsilon)$空间的"保持不变"区域时,工人的工作才会变成永久性的
423+
显然,当且仅当$(\theta_t, \epsilon_t)$进入$(\theta, \epsilon)$空间的"保持不变"区域时,劳动者的工作才会变成永久性的
424424
425425
令$S$表示这个区域,$T^*$可以表示为在最优策略下首次到达$S$的时间:
426426
@@ -472,7 +472,7 @@ median_time(greedy_star, F, G)
472472

473473
这些中位数会受随机性影响,但应该分别约为7和14。
474474

475-
不出所料,更有耐心的工人会等待更长时间才会安定在最终的工作岗位上
475+
不出所料,更有耐心的劳动者会等待更长时间才会安定在最终的工作岗位上
476476

477477
```{solution-end}
478478
```
@@ -507,7 +507,7 @@ ax.text(4.5, 1.5, '新工作', fontsize=14, rotation='vertical')
507507
ax.text(4.0, 4.5, '保持现状', fontsize=14)
508508
plt.show()
509509
```
510-
在新图中,你可以看到工人选择留在原地的区域变大了,这是因为 $\epsilon$ 的分布更加集中在均值附近,使得高薪工作的可能性降低了。
510+
在新图中,你可以看到劳动者选择留在原地的区域变大了,这是因为 $\epsilon$ 的分布更加集中在均值附近,使得高薪工作的可能性降低了。
511511

512512
```{solution-end}
513513
```

lectures/exchangeable.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -34,7 +34,7 @@ DeFinetti的工作对经济学家的相关性在David Kreps的{cite}`Kreps88`第
3434

3535
我们在本讲座中研究的一个例子是{doc}`这个讲座 <odu>`的一个关键组成部分,它扩充了
3636

37-
{doc}`classic <mccall_model>` McCall的经典工作搜索模型{cite}`McCall1970`通过为失业工人提供一个统计推断问题来展示
37+
{doc}`classic <mccall_model>` McCall的经典工作搜索模型{cite}`McCall1970`通过为失业劳动者提供一个统计推断问题来展示
3838

3939
我们创建图表来说明似然比在贝叶斯定律中所起的作用。
4040

lectures/finite_markov.md

Lines changed: 14 additions & 14 deletions
Original file line numberDiff line numberDiff line change
@@ -139,12 +139,12 @@ $$
139139
(mc_eg1)=
140140
### 示例1
141141

142-
让我们考虑一个工人的就业状态,在任何给定时间 $t$,该工人要么处于失业状态(状态0)要么处于就业状态(状态1)。
142+
让我们考虑一个劳动者的就业状态,在任何给定时间 $t$,该劳动者要么处于失业状态(状态0)要么处于就业状态(状态1)。
143143

144144
假设在一个月的时间内:
145145

146-
1. 一个失业工人找到工作的概率是 $\alpha \in (0, 1)$。
147-
2. 一个就业工人失去工作的概率是 $\beta \in (0, 1)$。
146+
1. 一个失业劳动者找到工作的概率是 $\alpha \in (0, 1)$。
147+
2. 一个就业劳动者失去工作的概率是 $\beta \in (0, 1)$。
148148

149149
在马尔可夫链模型中,我们有:
150150

@@ -168,7 +168,7 @@ P
168168
有了 $\alpha$ 和 $\beta$ 的值后,我们可以回答许多有趣的问题,例如:
169169

170170
* 一个人平均会失业多长时间?
171-
* 长期来看,一个工人有多大比例的时间处于失业状态
171+
* 长期来看,一个劳动者有多大比例的时间处于失业状态
172172
* 如果一个人现在有工作,那么在未来一年内他至少失业一次的概率是多少?
173173

174174
我们将在后续章节中详细探讨这些应用。
@@ -466,25 +466,25 @@ $$
466466
```
467467
我们研究的边际分布不仅可以解释为概率,还可以被理解为大数定律下大样本中实际观察到的横截面分布。
468468

469-
为了更好地理解这一点,让我们回到{ref}`前面讨论的<mc_eg1>`工人就业/失业动态模型。
469+
为了更好地理解这一点,让我们回到{ref}`前面讨论的<mc_eg1>`劳动者就业/失业动态模型。
470470

471-
想象一个大型工人群体,其中每个工人的职业生涯都遵循相同的动态过程,且每个工人的经历在统计上独立于其他工人
471+
想象一个大型劳动者群体,其中每个劳动者的职业生涯都遵循相同的动态过程,且每个劳动者的经历在统计上独立于其他劳动者
472472

473473
假设$\psi$代表当前在状态空间$\{ 0, 1 \}$上的*横截面*分布。
474474

475-
这个横截面分布反映了某一时刻就业和失业工人的比例
475+
这个横截面分布反映了某一时刻就业和失业劳动者的比例
476476

477477
* 具体来说,$\psi(0)$表示失业率。
478478

479479
如果我们想知道10个周期后的横截面分布会是什么样子,答案是$\psi P^{10}$,其中$P$是{eq}`p_unempemp`中给出的随机矩阵。
480480

481-
这一结果成立是因为每个工人的状态都按照矩阵$P$的规律演变,因此$\psi P^{10}$代表了随机选取的单个工人的边际分布
481+
这一结果成立是因为每个劳动者的状态都按照矩阵$P$的规律演变,因此$\psi P^{10}$代表了随机选取的单个劳动者的边际分布
482482

483483
根据大数定律,当样本规模足够大时,观察到的频率会非常接近理论概率。
484484

485485
因此,对于一个足够大(接近无限)的人口,
486486

487-
$\psi P^{10}$同时也代表了处于各个状态的工人比例
487+
$\psi P^{10}$同时也代表了处于各个状态的劳动者比例
488488

489489
这正是我们所说的横截面分布。
490490

@@ -701,7 +701,7 @@ $P$的每个元素都严格大于零是保证非周期性和不可约性的充
701701

702702
### 示例
703703

704-
回想我们之前{ref}`讨论过的 <mc_eg1>`关于某个工人就业/失业动态的模型。
704+
回想我们之前{ref}`讨论过的 <mc_eg1>`关于某个劳动者就业/失业动态的模型。
705705

706706
假设$\alpha \in (0,1)$且$\beta \in (0,1)$,一致遍历条件是满足的。
707707

@@ -713,7 +713,7 @@ $$
713713
p = \frac{\beta}{\alpha + \beta}
714714
$$
715715

716-
这个值表示长期来看,工人处于失业状态的平均时间比例 -- 我们将在后续章节中详细讨论这一解释。
716+
这个值表示长期来看,劳动者处于失业状态的平均时间比例 -- 我们将在后续章节中详细讨论这一解释。
717717

718718
不出所料,当$\beta \to 0$时,它趋近于零;当$\alpha \to 0$时,它趋近于一。
719719

@@ -857,7 +857,7 @@ $$
857857
858858
从横截面角度看,$p$ 表示整个人口中失业者的比例。
859859
860-
而根据刚才介绍的遍历性结果,$p$ 也表示单个工人长期来看处于失业状态的时间占比
860+
而根据刚才介绍的遍历性结果,$p$ 也表示单个劳动者长期来看处于失业状态的时间占比
861861
862862
这意味着,从长期来看,群体的横截面平均值与个体的时间序列平均值是一致的。
863863
@@ -976,7 +976,7 @@ $$
976976
```{exercise}
977977
:label: fm_ex1
978978
979-
根据{ref}`上述讨论 <mc_eg1-2>`,如果一个工人的就业动态遵循随机矩阵
979+
根据{ref}`上述讨论 <mc_eg1-2>`,如果一个劳动者的就业动态遵循随机矩阵
980980
981981
$$
982982
P
@@ -1032,7 +1032,7 @@ ax.hlines(0, 0, N, lw=2, alpha=0.6) # 在零处画水平线
10321032
10331033
for x0, col in ((0, 'blue'), (1, 'green')):
10341034
1035-
# 生成从x0开始的工人的时间序列
1035+
# 生成从x0开始的劳动者的时间序列
10361036
X = mc.simulate(N, init=x0)
10371037
10381038
# 计算每个n的失业时间比例

lectures/jv.md

Lines changed: 15 additions & 15 deletions
Original file line numberDiff line numberDiff line change
@@ -18,7 +18,7 @@ kernelspec:
1818
</div>
1919
```
2020

21-
# {index}`工作搜寻 VI:在职搜索 <single: Job Search VI: On-the-Job Search>`
21+
# {index}`求职搜索 VI:在职搜索 <single: Job Search VI: On-the-Job Search>`
2222

2323
```{index} single: Models; On-the-Job Search
2424
```
@@ -60,24 +60,24 @@ from numba import jit, prange
6060
```{index} single: 在职搜索; 模型
6161
```
6262

63-
令 $x_t$ 表示在特定公司就职的工人在 t 时刻的工作特定人力资本,$w_t$ 表示当前工资。
63+
令 $x_t$ 表示在特定公司就职的劳动者在 t 时刻的工作特定人力资本,$w_t$ 表示当前工资。
6464

6565
令 $w_t = x_t(1 - s_t - \phi_t)$,其中
6666

6767
* $\phi_t$ 是对当前职位的工作特定人力资本投资,且
6868
* $s_t$ 是用于获取其他公司新工作机会的搜索努力。
6969

70-
只要工人继续留在当前工作,$\{x_t\}$ 的演变由 $x_{t+1} = g(x_t, \phi_t)$ 给出。
70+
只要劳动者继续留在当前工作,$\{x_t\}$ 的演变由 $x_{t+1} = g(x_t, \phi_t)$ 给出。
7171

72-
当 t 时刻的搜索努力为 $s_t$ 时,工人以概率 $\pi(s_t) \in [0, 1]$ 收到新的工作机会。
72+
当 t 时刻的搜索努力为 $s_t$ 时,劳动者以概率 $\pi(s_t) \in [0, 1]$ 收到新的工作机会。
7373

7474
这个机会的价值(以工作特定人力资本衡量)是 $u_{t+1}$,其中 $\{u_t\}$ 是具有共同分布 $f$ 的独立同分布序列。
7575

76-
工人可以拒绝当前的工作机会并继续现有的工作
76+
劳动者可以拒绝当前的工作机会并继续现有的工作
7777

7878
因此,如果接受则 $x_{t+1} = u_{t+1}$,否则 $x_{t+1} = g(x_t, \phi_t)$。
7979

80-
令 $b_{t+1} \in \{0,1\}$ 为二元随机变量,其中 $b_{t+1} = 1$ 表示工人在时间 $t$ 结束时收到一个工作机会。
80+
令 $b_{t+1} \in \{0,1\}$ 为二元随机变量,其中 $b_{t+1} = 1$ 表示劳动者在时间 $t$ 结束时收到一个工作机会。
8181

8282
我们可以写成
8383

@@ -136,14 +136,14 @@ $\text{Beta}(2,2)$ 分布的支撑集是 $(0,1)$ - 它具有单峰、对称的
136136

137137
在我们求解模型之前,让我们做一些快速计算,以直观地了解解应该是什么样子。
138138

139-
首先,注意到工人有两种方式来积累资本从而提高工资
139+
首先,注意到劳动者有两种方式来积累资本从而提高工资
140140

141141
1. 通过 $\phi$ 投资于当前工作的特定资本
142142
1. 通过 $s$ 搜索具有更好的工作特定资本匹配的新工作
143143

144144
由于工资是 $x (1 - s - \phi)$,通过 $\phi$ 或 $s$ 进行投资的边际成本是相同的。
145145

146-
我们的风险中性工人应该专注于预期回报最高的工具
146+
我们的风险中性劳动者应该专注于预期回报最高的工具
147147

148148
相对预期回报将取决于$x$。
149149

@@ -167,7 +167,7 @@ $\text{Beta}(2,2)$ 分布的支撑集是 $(0,1)$ - 它具有单峰、对称的
167167

168168
1. 在任何给定状态$x$下,两个控制变量$\phi$和$s$将
169169

170-
主要作为替代品 --- 工人会专注于预期回报较高的工具
170+
主要作为替代品 --- 劳动者会专注于预期回报较高的工具
171171
1. 对于足够小的 $x$,搜索会比投资工作特定人力资本更可取。对于较大的 $x$,则相反。
172172

173173
现在让我们转向实施,看看是否能验证我们的预测。
@@ -388,9 +388,9 @@ plt.show()
388388

389389
总的来说,这些策略与我们在{ref}`上文<jvboecalc>`中的预测相符
390390

391-
* 工人根据相对回报在两种投资策略之间切换
391+
* 劳动者根据相对回报在两种投资策略之间切换
392392
* 对于较低的 $x$ 值,最佳选择是寻找新工作。
393-
* 一旦 $x$ 变大,工人通过投资于当前职位的特定人力资本会获得更好的回报
393+
* 一旦 $x$ 变大,劳动者通过投资于当前职位的特定人力资本会获得更好的回报
394394

395395
## 练习
396396

@@ -487,12 +487,12 @@ $\phi_t = \phi(x_t) \approx 0.6$。
487487
而 $\phi_t$ 收敛到约0.6。
488488
489489
由于这些结果是在 $\beta$ 接近1的情况下计算的,
490-
让我们将它们与*无限*耐心的工人的最佳选择进行比较
490+
让我们将它们与*无限*耐心的劳动者的最佳选择进行比较
491491
492-
直观地说,无限耐心的工人会希望最大化稳态工资
492+
直观地说,无限耐心的劳动者会希望最大化稳态工资
493493
而稳态工资是稳态资本的函数。
494494
495-
你可以认为这是既定事实——这确实是真的——无限耐心的工人
495+
你可以认为这是既定事实——这确实是真的——无限耐心的劳动者
496496
在长期内不会搜索(即,对于较大的 $t$,$s_t = 0$)。
497497
498498
因此,给定 $\phi$,稳态资本是映射 $x \mapsto g(x, \phi)$ 的正固定点 $x^*(\phi)$。
@@ -531,7 +531,7 @@ plt.show()
531531

532532
这与{ref}`jv_ex1`中得到的$\phi$的长期值相似。
533533

534-
因此,无限耐心的工人的行为与$\beta = 0.96$的工人的行为相似
534+
因此,无限耐心的劳动者的行为与$\beta = 0.96$的劳动者的行为相似
535535

536536
这看起来是合理的,并且帮助我们确认我们的动态规划解可能是正确的。
537537

0 commit comments

Comments
 (0)