マーク・ソーマ 「Googleトレンドを使って『今』を予測する」(2009年4月7日)/「ナウキャストの可能性とその限界」(2014年4月28日)

●Mark Thoma, ““Can Google Queries Help Predict Economic Activity?””(Economist’s View, April 07, 2009)


Googleのチーフエコノミストであるハル・ヴァリアン(Hal Varian)が現在取り組んでいる研究の概要について論じている。その研究ではGoogleトレンドを利用して経済の成り行きを予測することがテーマとなっているとのことだが、一般の人々も含めた読者の一人ひとりに対して研究への協力が仰がれている。

Predicting the Present with Google Trends”(「Googleトレンドを使って今を予測する」) by Hal Varian and Hyunyoung Choi

Googleが手にしている検索クエリのデータを経済活動の予測に役立てることはできるだろうか?

その答えは「予測」ということで具体的に何を意味するかで違ってくる。GoogleトレンドGoogleインサイト(Google Insights for Search)では検索ボリューム(特定のキーワードが検索された回数)の結果をリアルタイムで(即座に)手にすることが可能だが、月次ベースの経済データはその月が終わってから数日経ってから発表されるのが一般的である。つまりは公式のデータが発表されるまでには若干のラグ(遅れ)があるわけだが、そのことを踏まえるとGoogleが手にしている検索クエリのデータを経済活動の予測に役立てる術はあると言えるかもしれない。例えば、3月の新車販売台数の公式のデータが発表されるまでには4月の半ば頃まで待つ必要があるが、3月の最初の数週間の間にGoogleで「自動車(クルマ) 購入」(”Automotive/Vehicle Shopping”)というキーワードがどれだけの回数検索されたかがわかれば(公式のデータが発表されるのに先立って)3月中の新車販売台数の予測に役立てることができるかもしれないのだ。

かの有名な「経済学者」のヨギ・ベラ(Yogi Berra)はかつて次のように述べた。「予測というのは難しい。未来の予測となるとなおさらそうだ。」(”It’s tough to make predictions, especially about the future.”) 我々の研究はヨギ・ベラのこの言葉にヒントを得ている。未来の予測が困難だとすればもう少しハードルを下げて「今」を予測してみよう、というわけだ。

我々のこれまでの研究成果は“Predicting the Present with Google Trends”(pdf)の中でまとめられているが、Googleトレンドの検索データを使えば多岐にわたる経済時系列データ――新車販売台数住宅販売戸数小売売上高旅行・観光消費動向など――の今(現在)の値がどうなっているかを少しでも正確に予測する上で役立てることができるとの結果が得られている。

今を予測するということでさえも有益な作業である。というのも、時系列データの中から「ターニングポイント」(転換点、転機)をいち早く見つけ出す手助けとなるかもしれないからだ。ある地域で「不動産仲介業者」(”Real Estate Agents”)という単語の検索数が一気に増え出したとしたら、その地域で近々住宅の販売が上向きに転じようとしている兆しなのかもしれないのだ。

我々の論文では短期の経済予測を行うためのアプローチの一つが例示されているわけだが、他にも興味深いアプローチはいくつもあり得ることだろう。そこで予測が趣味だという読者にお願いである。Googleトレンドの検索データをダウンロードして、その検索データと様々な時系列データとの間に何かしらの関係が見つからないか自分で試しに探ってもらいたい。もし仮に面白いパターンを見つけ出すことができたとしたら、その発見を自分のサイトにアップしてecon-forecast@google.com宛てにリンクを送って欲しい [1] 訳注;今はもう受け付けていないかもしれない。「これは面白い!」という発見があれば後日このブログで紹介させていただくつもりだ。

百万匹の猿にそれぞれ一台ずつコンピューターをあてがって経済予測をさせれば、現実とピッタリ一致する予測を手にすることができるという話がある。その通りにいくかどうか確かめてみようではないか。

———————————————————————————————————————

●Mark Thoma, “‘New Data Sources: A Conversation with Google’s Hal Varian’”(Economist’s View, April 28, 2014)


ハル・ヴァリアンがmacroblogでインタビューに応じている。

New Data Sources: A Conversation with Google’s Hal Varian”(「新種のデータソース:ハル・ヴァリアンへのインタビュー」):

ここ最近のことだが、これまでにない新種のデータが爆発的な勢いで増加する一途を辿っている。そのような新種のデータソース(情報源)としてはGoogleやFacebook、Twitterを挙げることができるが、このような新種のデータに対して経済学者やセントラルバンカーの間で関心が高まり出している。新種のデータを利用すれば経済の実態について有益な洞察を得ることができるかもしれない。そうすれば政策を策定する上で有用な情報が手に入ることになり、政策の改善にもつながるかもしれないとそう見なされ始めているのだ。

Googleのチーフエコノミストでありカリフォルニア大学バークレー校の名誉教授でもあるハル・ヴァリアンはこういった(新種のデータソースをめぐる)問題を論じる上でうってつけの人物である。つい先週のことだが、そのヴァリアンが忙しいスケジュールの合間を縫って我々のインタビューに応じてくれた。インタビューでは新種のデータソースを利用することにはどんな利点があるのか?、新種のデータソースが抱える限界は何か?といった話題について意見が交わされたが、以下にそのインタビューの模様を採録しておこう。

マーク・カーティス(以下、カーティス): Googleが手にしているデータを利用すれば「ナウキャスト」(”nowcast”)の能力を高めることができる。あなたは常々そう仰っていますね。「ナウキャスト」とは何なのでしょうか? Googleが収集しているデータの量は莫大なものですが、一体どうすればその莫大なデータを『今』をより正確に理解するために役立てることができるとお考えでしょうか? こういった点についてご説明願えるでしょうか?

ハル・ヴァリアン(以下、ヴァリアン): 「ナウキャスト」(あるいは「ナウキャスティング」)の最も手っ取り早い定義は「同時予測(今何が起こっているかを現在進行形で予測する)」(”contemporaneous forecasting”)とでもいうことになるでしょうが、デビッド・ヘンリー(David Hendry)も指摘しているようにこの定義はあまりにもシンプルすぎるかもしれませんね。ともあれ、ここ10年かそこらの現象ですが、民間の多くの企業は経営指標の動きをその日ごとに(日次ベースで)跡付けるためにリアルタイム型データウェアハウス(DWH)の開発に何十億ドルもの大金を投じるようになっています。リアルタイム型データウェアハウスの対象となる経営指標としては小売売上高(ウォルマート社やターゲット社のケース)や配送データ(UPS社やFedEx社のケース)、クレジットカードの利用額(マスターカード・スペンディングパルス)、雇用統計(インテュイット社作成の中小企業雇用指数)をはじめとしてその他にも色々と考えられます。これまでのところ私は主にGoogleのデータに目をつけて研究を進めてきているわけですが、その理由は立場上Googleのデータには容易に近付くことができるからというにすぎません。Googleの外に目を向けても新種のデータソースは数多くあります。

カーティス: 「ナウキャスト」はFedにとっても極めて重要な意味を持っています。昨年(2013年)12月の記者会見の席上でのことですが、ベン・バーナンキ前FRB議長が概ね次のように述べています。リアルタイムの情報が不足していたことも一因となってFedは危機の存在を認識するのが遅れてしまったかもしれない、と。Googleの検索データのような新種のデータソースの助けを借りればFedが経済の現状や今後の成り行きを把握する能力を高めることは可能だとお考えでしょうか?

ヴァリアン: はい。その可能性は大いにあると思います。先ほども触れたような(リアルタイムでの情報の入手を可能とする)新種のデータソースはとっかかりとして適当だと思います。Googleが収集している検索データは失業保険の新規申請件数や住宅販売戸数、住宅ローンの条件変更の実数といったデータをリアルタイムで推計する上で役立つのではないかと思われます。

カーティス: 労働市場の実態を掴むには失業率だけを注視するのではなく、雇用情勢に関するその他の指標にも幅広く目を配る必要がある。ジャネット・イエレン現FRB議長が議長就任後初めて出席した記者会見の場でそう語っています(アトランタ連銀では雇用情勢に関する複数の指標から成るレーダーチャートを作成・公表している)。Googleが作成している指標の中で労働市場の実態がどうなっているかを掴む手助けとなりそうなものはあるでしょうか?

ヴァリアン: ありますね。職探しに関係が深い検索キーワード(の検索数)は労働市場の実態を指し示す指標として使えるようです。興味深いことですが、暇つぶし(killing time)と関係の深い検索キーワード(の検索数)も失業の動きと相関しているようなんですよ!

カーティス: 新種のデータソースの利用に伴うマイナス面あるいは隠れた欠陥のようなものは何でしょうか?

ヴァリアン: 一つ目は、クレジットカードの利用額のような経済取引の裏付けがあるデータの方がGoogleの検索データよりも実態(実際に何が起こっているか)をより正確に反映している可能性があるということです。検索というのはあくまでも意図の問題にすぎません [2] … Continue readingが、クレジットカードでお金を支払っている場合は実際に経済取引が発生しています。二つ目は、Googleが収集している検索データはニュース報道の影響を受ける可能性があることです。失業の増加を伝えるニュースが報道されると多くの人がこぞって「失業率」というキーワードを検索窓に入力し、そのために「失業率」というキーワードの検索数が急増することになるかもしれません。そのため、検索データを解釈する際はこの点に注意する必要があります。三つ目は、Googleが利用できるようになってから景気後退はまだ一度しか起こっていないということです。それも今回の景気後退は金融危機に端を発するものです。景気後退は金融危機以外にも(原油価格の高騰のような)サプライショックや(1980年代初頭においてのように)金融引き締めを原因としても起こり得ます。今回の景気後退(というたった一つの例)に当てはまる話を他の例にまで安易に一般化し過ぎないように気を付ける必要があるでしょう。

カーティス: GoogleやTwitter、Facebookを通じて得られるデータの量はいや増す一方なわけですが、このような状況が今後も続くようであれば国勢調査局や労働統計局といった公的な統計機関の役割は将来的に縮小していくと思われますか? あるいは公的な統計機関はもうお役御免だというところまでいく可能性もあり得ると思われますか? 仮に「いや、そういうことはない」というお考えだとしたら、将来的にデータの取り扱いをめぐって公的な統計機関とGoogleのような民間企業とが手を取り合って協働する可能性はあるとお思いですか?

ヴァリアン: 公的な統計機関はデータ収集の世界における金字塔的な存在です。Googleの検索データのようなリアルタイムの情報が(公的な統計機関が収集している)従来のデータの先行指標の役割を果たすなどといったように両者が互いに補完し合う可能性はあり得ますが、新種のデータが従来のデータに取って代わることはありそうもないというのが私の考えです。情報をリアルタイムで入手するために民間部門と公共部門が実りあるかたちで互いに手を取り合い、お互いにそれぞれ恩恵を得るような結果になればと望んでいます。

カーティス: 数年前の話になりますが、バーナンキ前FRB議長が経済学の研究者たちに対して次のような挑戦を投げ掛けました。「将来に対する人々の予想を計測するために新たな指標を作成したり新たな聞き取り調査を行う必要はあるだろうか? 企業が価格についてどのような予想を抱いているか――そもそも製品の価格を設定している主体は企業である――、名目賃金の今後の伸びに関してどのような予想が抱かれているかといった情報はとりわけ乏しいのが現状である。」 Googleが手にしているデータはバーナンキ前FRB議長の挑戦に応じ得るだけの可能性を秘めているでしょうか?

ヴァリアン: つい最近のことになりますが、GoogleではGoogle Consumer Surveysと呼ばれる消費者調査サービスを開始しました。このサービスでは幅広い範囲の消費者が調査の対象となっています。今のところは企業の経営者や求職中の失業者などは調査の対象となっていませんが、将来的に調査対象に加えることも検討中です。

カーティス: マサチューセッツ工科大学(MIT)が乗り出したばかりの「ビリオン・プライス・プロジェクト」(Billion Prices Project)ではビッグデータの活用を通じてインフレの計測が試みられています。インフレを計測するためにビッグデータを活用するこのような試みには輝かしい未来が待っているとお思いでしょうか?

ヴァリアン: ええ、そう思います。スーパーマーケットのスキャナーデータに目をつけてインフレの計測を試みるプロジェクトもあるみたいですね。しかし、オンラインデータの活用を通じてインフレを計測する試みには難点もあります。ガソリンや電気、住宅、大型の耐久消費財といったカテゴリーの価格データが調査対象に含まれていないことがそれです。その一方で、裁量的な支出の対象となる消費財の価格データを収集する上では向いていると言えるでしょう。以上のことを踏まえると、オンラインデータを活用した価格調査は特定のカテゴリーの消費財の価格データを収集する上でお手軽な手法となる可能性はありますが、インフレを計測するための従来の手法(公的な統計機関が消費者物価指数を作成するために用いている手法)に取って代わることはないでしょう。

References

References
1 訳注;今はもう受け付けていないかもしれない
2 訳注;例えば、ある人が「自動車 購入」というキーワードで検索したとしてもその人が実際に自動車を購入するかどうかはわからない。あくまでも自動車の購入を視野に入れている(自動車の購入を意図している)にすぎない可能性も大いにある。
Total
1
Shares
0 comments

コメントを残す

Related Posts