Skip to content

Commit

Permalink
more explanation on cluster
Browse files Browse the repository at this point in the history
  • Loading branch information
Tetsu HARUYAMA authored and Tetsu HARUYAMA committed Aug 30, 2023
1 parent b2d2462 commit c4ece0d
Showing 1 changed file with 25 additions and 4 deletions.
29 changes: 25 additions & 4 deletions 17_Panel.ipynb
Original file line number Diff line number Diff line change
Expand Up @@ -1875,9 +1875,9 @@
"* 残差の不均一分散\n",
" * 固定効果モデルは,変数の変換後に通常のOLS推定をおこなうため,残差に不均一分散が存在するかも知れない。([不均一分散](chap:14-hetero)を参照。)\n",
"* 残差の相関\n",
" * 直感的に説明するために次の例を考えよう。賃金のパネル・データを作成する際に,まず複数の会社をランダムに抽出し,それらの会社から複数の労働者をランダム抽出することにより,各労働者の時系列データを収集するとしよう。\n",
" * **<個体内での残差の相関>** 労働者Aさんを考えよう。Aさんへの今期のショックは前期のショックに影響されるかも知れないため,残差には自己相関の可能性がある。Bさんも,Cさんも,,,Zさんにも同様のことが言えるかも知れない。このタイプの相関は,**個体内**での期間間の残差の相関である\n",
" * **<個体間での残差の相関>** ある期間を考えよう。会社Firm0で働くA0さん,B0さん,C0さん,,,Z0さんは,同じ会社で働いているため共通の特徴があり,残差は相関するかも知れない。別の会社Firm1で働くA1さん,B1さん,C1さん,,,Z1さんも,同様に残差は相関する可能性がある。このタイプの相関は,期間内での**個体間**の残差の相関である\n",
" * 直感的に説明するために次の例を考えよう。賃金のパネル・データを作成する際に,まず複数の会社をランダムに抽出し,それらの会社から複数の労働者をランダム抽出することにより,各労働者の時系列データを収集するとしよう。パネル・データ分析をすると次の残差の相関が発生する可能性がある。\n",
" * **<個体内での残差の相関>** 労働者Aさんを考えよう。理想的な仮定の下では,Aさんの残差は時系列的に独立となる。しかし,その仮定が満たされない場合,Aさんの残差には自己相関が存在することになる。Bさんも,Cさんも,,,Zさんにも同様のことが言える。このタイプの相関は,**個体内**での期間をまたがる残差の相関である\n",
" * **<個体間での残差の相関>** ある期間を考えよう。会社Firm0で働くA0さん,B0さん,C0さん,,,Z0さんは,同じ会社で働いているため共通の特徴があり,残差は相関するかも知れない。別の会社Firm1で働くA1さん,B1さん,C1さん,,,Z1さんも,同様に残差は相関する可能性がある。このタイプの相関は,期間内での**個体間**の残差の相関となる\n",
"\n",
"これらの問題が発生しても,基本的な仮定の下(特に,[GM仮定4が満たされない場合](chap:18-GM4)で詳しく検討するガウス・マルコフ定理4が満たされる場合)でFE推定量は不偏性と一致性を満たす。しかし,係数の標準誤差は有効ではなくなり検定が無効となる。その対処方法として,`linearmodels`には主に次の2つの方法が用意されている。\n",
"\n",
Expand Down Expand Up @@ -2030,6 +2030,7 @@
{
"cell_type": "markdown",
"metadata": {
"heading_collapsed": true,
"hidden": true
},
"source": [
Expand Down Expand Up @@ -2112,7 +2113,27 @@
"hidden": true
},
"source": [
"不均一分散頑健推定とクラスター頑健推定の係数の標準誤差(従って,`t`値と`p`値)は異なる。理由は,残差にある個体ごとの自己相関の存在である。実際,残差の自己相関AR(1)を検定すると,その存在を棄却できない。従って,不均一分散頑健推定は自己相関を取りこぼすことになり,標準誤差が小さくなっている。"
"不均一分散頑健推定とクラスター頑健推定の係数の標準誤差(従って,`t`値と`p`値)は異なる。理由は,残差にある個体ごとの自己相関の存在である。実際,残差の自己相関AR(1)を検定すると,その存在を棄却できない。従って,不均一分散頑健推定は自己相関を取りこぼすことになり,標準誤差が小さくなり,`p`値が小さくなっている。"
]
},
{
"cell_type": "markdown",
"metadata": {
"hidden": true
},
"source": [
"````{note}\n",
"固定効果モデルを使いクラスター頑健推定について説明したが,ランダム効果モデルや通常の回帰分析でも使うことができる。例えば,通常の回帰分析の場合は次のコードとなる。\n",
"```\n",
"formula = 'lwage ~ 1 + married + union + expersq \\\n",
" +d81+d82+d83+d84+d85+d86+d87'\n",
"mod = PooledlOLS.from_formula(formula, data=wagepan)\n",
"res = mod.fit(cov_type='clustered',\n",
" cluster_entity=True,\n",
" group_debias=True)\n",
"```\n",
"クラスター頑健推定の妥当性は,データの収集プロセスなどを考慮して検討する必要があるだろう。\n",
"````"
]
}
],
Expand Down

0 comments on commit c4ece0d

Please sign in to comment.