マーク・ソーマ 「Googleトレンドを使って『今』を予測する」(2009年4月7日)/「ナウキャストの可能性とその限界」(2014年4月28日)

●Mark Thoma, ““Can Google Queries Help Predict Economic Activity?””(Economist’s View, April 07, 2009)


Googleのチーフエコノミストであるハル・ヴァリアン(Hal Varian)によると、Googleトレンドを使って景気の足取りを予測できるかを研究中だという。研究への協力も仰(あお)いでいるようだ。

Predicting the Present with Google Trends”(「Googleトレンドを使って今を予測する」) by Hal Varian&Hyunyoung Choi

Googleの検索クエリを経済活動の予測に役立てることはできるだろうか?

その答えは、「予測」というのが何を意味するかによって違ってくる。GoogleトレンドGoogleインサイト(Google Insights for Search)では、検索ボリューム(特定のキーワードが検索された回数)が即座に計算されて公表される。その一方で、経済の公式データは月が終わって数日経ってから発表されるのが一般的である。公式のデータが発表されるまでに若干のラグ(遅れ)があるわけだ。例えば、3月中の新車販売台数の公式のデータが発表されるのは4月の半ば頃だ。その一方で、3月の最初の数週間の間に「自動車(クルマ) 購入」(“Automotive/Vehicle Shopping”)というキーワードがググられた(Googleで検索された)回数がわかれば、3月中の新車販売台数がどのくらいかを予測するのに役立つかもしれないのだ。

かの有名な「経済学者」のヨギ・ベラ(Yogi Berra)は、かつて次のように述べた。「予測というのは難しい。未来の予測となると、特に難しい」(”It’s tough to make predictions, especially about the future.”)。我々の研究は、ヨギ・ベラのこの言葉にヒントを得ている。「未来」の予測が難しいのなら、もう少しハードルを下げて、「今」を予測してみようというわけだ。

我々のこれまでの研究成果は、「Googleトレンドを使って今を予測する」――“Predicting the Present with Google Trends”(pdf)――と題された論文にまとめられている。Googleトレンドの検索データは、多岐にわたる経済時系列データ――新車販売台数住宅販売戸数小売売上高旅行・観光消費動向――の今の値がどうなっているかを予測する精度を高める手助けになり得るというのが我々が見出している結果である。

今を予測するのでさえも役に立つ。時系列データの中から「ターニングポイント」(転換点、転機)をいち早く見つけ出す手助けになるかもしれないからだ。どこかの地域で「不動産仲介業者」(“Real Estate Agents”)というキーワードの検索数が一気に増え始めたとしたら、その地域で近いうちに住宅の販売が増える兆しなのかもしれないのだ。

我々の論文では、短期の経済予測を行うためのアプローチの一つについてその概要を説明しているが、他にも興味深いアプローチが見つかるのではないかと思う。そこで、予測が趣味だという読者にお願いである。Googleトレンドの検索データをダウンロードして、そのデータといずれかの時系列データとの間に何らかの関係が見つからないか探ってもらいたいのだ。面白いパターンを見つけ出したようなら、その発見を自分のサイトにアップして、econ-forecast@google.com宛てにリンクを送ってほしい。「これは面白い!」という発見があれば、このブログで追って紹介させてもらうつもりだ。

百万匹の猿にそれぞれ一台ずつコンピューターをあてがえば、そのうち正確な(現実とピッタリ一致する)経済予測が弾き出されるなんていう話がある。その通りにいくかどうか確かめてみようじゃないか。

———————————————————

●Mark Thoma, “‘New Data Sources: A Conversation with Google’s Hal Varian’”(Economist’s View, April 28, 2014)


ハル・ヴァリアンがmacroblogでインタビューに応じている。

New Data Sources: A Conversation with Google’s Hal Varian”(「新種のデータソース:ハル・ヴァリアンへのインタビュー」):

これまでにない新種のデータが近年に入って爆発的な勢いで増えており、経済学者やセントラルバンカーの間でも関心が高まっている。Google、Facebook、Twitterを通じて得られる新種のデータを利用すれば、経済の実態について有益な洞察が得られるかもしれない。ひいては、政策当局者が何らかの決定を下す時のヒントになり、よりよい決定が下せるようになるかもしれない。

Googleのチーフエコノミストで、カリフォルニア大学バークレー校の名誉教授でもあるハル・ヴァリアンは、新種のデータソースに関わるあれこれの争点について談じ合う相手としてうってつけの人物である。そのヴァリアンが忙しいスケジュールの合間を縫って我々のインタビューに応じてくれた。新種のデータを利用すれば、どんな見返りが得られるのだろうか? 新種のデータが抱えている限界とは何なのだろうか?

マーク・カーティス(以下、カーティス):Googleが集めているデータを利用すれば、「ナウキャスト」(“nowcast”)の能力を高めることができると前から仰っていますね。「ナウキャスト」とは何なのでしょうか? 「ナウキャスト」の能力を高めるために、Googleが集めている莫大な量のデータをどのように活用できるとお考えでしょうか?

ハル・ヴァリアン(以下、ヴァリアン):「同時予測(今何が起こっているかを現在進行形で予測すること)」(“contemporaneous forecasting”)というのが、「ナウキャスト」の最も手っ取り早い定義です。デビッド・ヘンリー(David Hendry)も指摘しているように、この定義はあまりにもシンプルすぎるかもしれませんが。ともあれ、ここ10年かそこらの現象ですが、経営指標の日々の動きをリアルタイムに(間を置かずに現在進行形で)把握するために、何十億ドルもの大金を投じてデータウェアハウス(DWH)の開発に乗り出している企業がちらほら出てきています。ウォルマート社やターゲット社であれば、小売売上高。UPS社やFedEx社であれば、配送データ。マスターカード社であれば、クレジットカードの利用額。インテュイット社であれば、中小企業雇用指数。他にも例はたくさんありますが、経営指標の日々の動きをリアルタイムに把握しようとする試みが広がっています。私がGoogleのデータに狙いを定めているのは、立場上Googleのデータを容易に利用できるからに過ぎません。新種のデータソースは、他にもたくさんあります。

カーティス:「ナウキャスト」、言い換えると、今を予測する能力ですが、その能力というのは、Fed(連邦準備制度)にとっても極めて重要です。昨年(2013年)12月の記者会見の席上で、ベン・バーナンキ前FRB議長が次のように述べています。Fedが危機に気付くのが遅れてしまった一因は、リアルタイムの情報が不足していたためかもしれない、と。Googleの検索データのような新種のデータの助けを借りれば、Fedが経済の現状や今後の先行きを把握する能力を高めることができるとお考えでしょうか?

ヴァリアン: はい。その可能性は大いにあると思います。先ほども触れたようなリアルタイムに情報を得られるデータソースは、とっかかりとして適当だと思います。Googleの検索データは、失業保険の新規申請件数、住宅販売戸数、住宅ローンの条件変更だとかをリアルタイムに推計するのに役立つのではないかと思います。

カーティス:労働市場の実態を掴むためには、失業率だけでなく、雇用情勢と関わりのあるその他の指標にも幅広く目を配る必要がある。議長就任後初めての記者会見で、ジャネット・イエレン現FRB議長がそのように語っています(アトランタ連銀は、雇用情勢と関わりのある複数の指標を組み込んだレーダーチャートを公表している)。Googleの検索データを基にして作成できる指標の中で、労働市場の実態がどうなっているかを掴むのに役立ちそうなものはあったりするでしょうか?

ヴァリアン:ありますね。職探しに関わりのある語句の検索数は、労働市場の実態を掴むのに役立つみたいです。興味深いことに、暇つぶし(killing time)と関わりのある語句の検索数も失業率と相関している[1] 訳注;失業率が高まるにつれて、暇つぶしと関わりのある語句の検索数も増える、という意味。みたいなんですよ。

カーティス:新種のデータソースが抱えているマイナス面は何でしょうか? 隠れた落とし穴のようなものは?

ヴァリアン:まず一つ目は、クレジットカードの利用額のような経済取引の裏付けがあるデータの方が、Googleの検索データよりも実態(実際に何が起こっているか)をより正確に反映している可能性があることです。検索というのは、あくまでも意図を捉えているに過ぎませんが  [2] … Continue reading、クレジットカードで代金を払う場合は実際に経済取引が発生しています。二つ目は、Googleの検索データは、ニュース報道の影響を受ける可能性があることです。失業の急増を伝えるニュースが報道されると、「失業率」という語句の検索数が一挙に増えるかもしれません。そのため、検索データの解釈には慎重になる必要があります。三つ目は、Googleが登場してからまだ一度しか景気後退が起きていないことです。直近の景気後退は、金融危機に端を発しています。しかしながら、(原油価格の高騰のような)サプライショックがきっかけで景気後退が起こることもあれば、(1980年代初頭のように)金融引き締めがきっかけで景気後退が起こることもあります。景気後退は色んなきっかけで起こるわけですから、たった一度の経験を過度に一般化しないように慎重になる必要があるでしょう。

カーティス:Google、Twitter、Facebookを通じて得られるデータの量は増す一方ですが、この調子でいくと国勢調査局や労働統計局といった公的な統計機関の役割は将来的に縮小していくと思われますか? あるいは、公的な統計機関はお役御免になる可能性だってあると思われますか? 「いや、そうはならない」というお考えだとしたら、公的な統計機関とGoogleのような民間企業が手を取り合って協働する可能性もあるとお思いでしょうか?

ヴァリアン:公的な統計機関は、データ収集の世界における大黒柱的な存在です。Googleの検索データのようなリアルタイムの情報が、(公的な統計機関が収集している)従来のデータの先行指標の役割を果たしたりして両者が互いに補完し合う可能性はあると思います。しかしながら、新種のデータが従来のデータに取って代わることはありそうもないというのが私の考えです。民間部門と公共部門が手を取り合って、リアルタイムの情報を実りあるかたちで活用できればと願っていますし、その結果としてどちらも得をする展開になることを願っています。

カーティス:数年前に遡りますが、バーナンキ前FRB議長が次のように語って、経済学者たちに向けて挑戦状を叩きつけています。「将来に対する予想を計測するために、新たに指標を作成する必要はあるだろうか? 新たに聞き取り調査を行う必要はあるだろうか? 企業――価格を設定しているまさにその主体である企業――が将来の価格についてどう予想しているかについても、名目賃金のこれからがどう予想されているかについても、情報が乏しいのが現状なのだ」。Googleが集めているデータは、バーナンキ前FRB議長の挑戦に応じられるだけの可能性を秘めているでしょうか?

ヴァリアン:新しく開始されたばかりの「Google Consumer Surveys」と呼ばれるサービスを使えば、幅広い層の消費者に対して聞き取り調査を行うことができます。企業の経営者や求職中の失業者なんかは今のところは対象になっていませんが、将来的に対象に加えることもあり得ます。

カーティスマ:マサチューセッツ工科大学(MIT)が手掛けている「ビリオン・プライス・プロジェクト」(Billion Prices Project)では、インフレ率をリアルタイムに計測するために、ビッグデータが活用されています。このような試みには、輝かしい未来が待っているとお思いでしょうか?

ヴァリアン: ええ、そう思います。インフレ率をリアルタイムに計測するために、スーパーマーケットのスキャナーデータを活用しているプロジェクトもあるみたいですね。しかしながら、オンラインデータを使ってインフレ率を計測しようとする試みには難点もあります。ガソリン、電気、住宅、大型の耐久消費財だとかの価格が調査対象に含まれていないのです。その一方で、生活必需品ではない商品の価格がどうなっているかをリアルタイムに把握するのには長(た)けていると言えるでしょう。そんなわけで、オンラインデータを活用すれば、特定のカテゴリーの商品に関してはその価格がどうなっているかを費用をかけずに素早く把握できるでしょうが、インフレ率を計測するための従来の手法(公的な統計機関が消費者物価指数を作成するために用いている手法)に取って代わることはないと思います。

References

References
1 訳注;失業率が高まるにつれて、暇つぶしと関わりのある語句の検索数も増える、という意味。
2 訳注;例えば、「自動車 購入」という語句を入力して検索したとしても、実際に自動車を購入するかどうかはわからない。そのうちいつか自動車を買い替えようかなとぼんやり考えているに過ぎない可能性も大いにある。
Total
1
Shares
0 comments

コメントを残す

Related Posts