経済学101は主に皆様の寄付によって賄われています。温かい支援をお待ちしています

フランシス・ウーリー「計量経済学初心者が間違ったことに一生懸命になるのはなぜなのか」

Frances Woolley “Why do beginner econometricians get worked up about the wrong things?” (Worthwhile Canadian Initiative, March 23, 2014)

(訳者補足:本エントリは計量経済学を学んだことがある方向けですので、あらかじめご承知おきください。)


初めて回帰分析にかけてみるとき、初歩的な間違いをする人が多い。配偶者の労働時間のような、サンプルの半分以上に欠けている変数を含めることで、うかつにも大量のオブザベーションを弾いてしまったりする。また、そうすることに何の意味もないときでさえ、全てのオブザベーションをデータセットに入れたりする。例えば、運転中に携帯電話で通話する人を予測するための回帰分析に、運転可能年齢未満の個人を含めてしまったりといった具合だ。また、子供の有無や婚姻状況といった、ほぼ間違いなく分析にとって重要な変数を制御するのに失敗してバイアスを作り出してしまう。

それでも私のオフィスアワーに来て、「僕はサンプルを適切に選んだでしょうか?」といった具合に尋ねてくる人があることは稀だ。その一方で毎年毎年、学生たちはプロビットやロジットのモデルの使い方を学ぶことに取りつかれていて、それはもう0-1の従属変数を最小二乗法の回帰にかけようものならコンピュータが爆発するか計量経済学の神の罰でも食らうんじゃないかといった具合だ。

「ほら、それは重要じゃない。結果に何ら大した違いが生まれないんだから。ロジットやプロビットの係数の直観的な解釈をひねり出すのは難しいし、限界効果を計算するのも手間だ。やりたいならロジットやプロビットを使ってもいいけど、回帰に何かおかしなところがないかどうか僕が教えてあげられるように、線形確率モデルにもかけてくれ。」と説明しようとはしている。

でも彼らは信じてくれないのだ。

デイブ・ジルスの言う、他の全てが同じであるなら、最小二乗法よりもプロビットを使うほうが良いし、Stataのmarginsのコマンドは学部生にとっても難しくないということを認めるのにやぶさかではない。

しかし他の全ては同じではないのだ。小さな子供を持っていることが雇用されている確率に対して与える影響を推定するときに男性と女性を一つのサンプルに一緒くたにしている回帰をプロビットが助けてくれるわけでもなく、性別と子供の有無の相互作用項を除外してしまう。(ここでの問題は、子供は男性にとって雇用されている確率を上昇させる一方で、女性にとっては雇用されている確率を下げるということだ。この2つの効果は、男性と女性の両方を含むサンプルでは打ち消されてしまう。)

サンプルを適切に定義し、欠けている値へ対処し、明らかに内生的な独立変数の見当がつき、どの説明変数をモデルに含めるという判断をするといったことが出来るようになって初めて、線形確率モデルに対するプロビットの相対的な利点について話す価値が出てくる。そうなるまでは、regressコマンドを使うように私は教えている。お尻に “robust” コマンドを付けたければ付けなさいと言いつつね。

だが聞いてはくれないのだ。

こうしたことは全て、計量経済学の教わり方に端を発している。全てではないが、ほとんどの計量経済学のクラスは統計理論を強調する。学生たちは回帰分析をかける場合があったとしても、それらは分析のパラメーターがきっちりと定義されたパック詰めで準備万端の例題だったり、単なる反復練習だったりする。

計量経済学がこうした形で教えられているのは、単純で実際的な理由からだ。つまり簡単だからなのだ。学生たち全員が自分独自のデータをダウンロードし、独特な問題に取り組み、新しい独創的なモデルを詳細化する場合、学生一人一人にたくさんの手助けと注意を払う必要がある。答案をTAに任せることもできない。個々に研究課題とデータセットが異なっていて、全員に当てはまるような単純な回答を書いておくことはできないからだ。しかし学生たちの回帰分析の最初の四苦八苦の段階を読むのに時間を費やすのは膨大な量の仕事になる。計算や短答式の問題、理論の説明からなる最終試験に丸を付けるほうがずっと簡単だ。

私が担当する今年の優等生用授業では誰もそうした楽な道はとらないため、困難な歩みとなる。

計量経済学はひとつの旅だ。ロジットとプロビットは知へ至るための石段の一つでしかない。ひとたびプロビットに辿り着いて限界効果を簡単に計算することができても、別の関門が待っている。それはブートストラップ標準誤差だったり、サンプル選択バイアスの修正だったりする。最終的な目標である因果関係の特定化には一生到達できない可能性もあるが、私たちはそれでも旅を続けるのだ。

全ての計量経済学者は彼らが言うところの「やれることには限りがあり、これが完璧ではないことを分かってはいるが私はこの回帰をやり続けるんだ」というところにだ度り着くということを、学生たちは気付く必要がある。

研究者志望者たちへのアドバイスとしては、不思議の国のアリス1 からの引用が気に入っている。

はじめからはじめなさい…そして最後まで続けなさい。そうなったら止まりなさい。

優れた応用計量経済学のはじめは理論の定式化、つまり何が重要でそれは何故なのかという仮説だ。その次の段階は、そのモデルを適用するサンプルの特定かだ。そして次に来るのがモデルの詳細化で、説明変数と説明される物事との間の関係を確立する何らかの方法を見つけ出すことだ。ここに至ってのみ、プロビットと線形確率モデルの間の選択といったようなことを考える意味がでてくる。

はじめからはじめなさい。そして最終答案ができるまで続けなさい。そうなったら止まりなさい。

  1. 訳注;原文では鏡の国のアリス(Alice through the Looking Glass)となっているが、実際には不思議の国のアリスの一節なので訂正している。 []

Comments

  1. 翻訳乙です。「0-1 dependent variable」は「0-1の従属変数」ですね。

  2. 細かい点ですが第2パラグラフの「勤務時間」は「オフィスアワー」,つまり教師があらかじめ授業への質問などのために指定している(水曜1-3pmとか)面会時間のことですね。「オフィスアワー」という語を大学でも日本語でそのまま使っていますので,そのままで良いかと。

コメントを残す