アレックス・タバロック「ヒラリー・クリントンのデータ分析の皮肉」

[Alex Tabarrok, “The Irony of Hillary Clinton’s Data Analytics,” Marginal Revolution, September 8, 2016]

バラク・オバマの大統領選挙ではデータが採用された.他方,ヒラリー・クリントンの選挙戦は,はじめからデータによって形成されている.『ポリティコ』がすごい記事を掲載している:

クリントンの分析担当部署のスタッフたちが座る席の上には,天井からつり下げられた標識にこう印刷されている――「統計的に有意」.そして,選挙対策の司令部がせわしなく活動していない真夜中のほんの数時間には,分析チームのコンピュータが秋の大統領選挙について40万通りのシミュレーションを実行している.やろうとしているのは,ようするに,11月8日にありうる事態の大規模なストレステストだ.

(…)「ここまで分析を重視した選挙戦なんて,見たことありません」と参謀役[の一人]は語った.とはいっても,〔かつてオバマの大統領選を支えたアナリストの〕クリーゲルのデータがクリントンの選挙戦の指針を変えたといった話ではない.そもそもクリーゲルのデータが選挙戦の指針を描き出さないかぎりクリントンの選挙戦ははじまりすらしないという方が正しい.

(…)チームのやっていることに詳しい人々によれば,クリーゲルの分析チームが研究して開拓した領域として,「誰に語りかけるか」「その相手に何をどうを語るか」だけでなく「いつ語りかけるか」までも数値評価することがあげられる.有権者に接触する最良のタイミングは,投票日の90日前だろうか,60日前だろうか,1週間前だろうか? それとも,前夜? この問いが有権者を動員するために決定的に重要だと認識したのは2012年のオバマ選挙対策チームだったが,これまで本当に分析されたことはなかった.競争のきびしい予備選の日程が掲載されたカレンダーをにらみながら,クリーゲルと彼のチームには,厳格な対照群実験を次々に実施する機会がたっぷりあった.そして.こうした問いの答えを今年すでに探り出していた.

予備選で〔一般党員の代理人として大統領候補に投票する〕代議員が自陣営にくつがえる可能性を推定するのに使われたアルゴリズムについて述べた箇所が面白い:

まず,選挙対策陣営では,そこで遊説すればクリントン側に「反転する」かもしれない確率であらゆる代議員選挙区をランク付けした.どの選挙区をとってみても,人口に応じて割り当てられる代議員の人数は異なる(たとえばオハイオ州の選挙区のうち12地区には代議員がそれぞれ4名ずついたが1つの選挙区には17名いた).そのため,クリントン支持に反転する確率を割り出す作業では,世論調査をもとにクリントンの予想支持レベルをモデル化し,特定地域の有権者を説得できる度合いを割り出し,自陣営に代議員をもう1人くつがえさせる閾値にクリントンがどれくらい近いのかを見なくてはならない.(ごく基本的なレベルでは,たとえば代議員の数が4名など偶数の選挙区はきわめて好ましからざる地区となる.なぜなら,バーニー・サンダースとクリントンのどちらか一方が投票の75パーセントを獲得しない限り2対2にわかれる見込みとなるからだ.)

こうした作業の後,メディアマーケットによって報道された座席・されなかった座席の情報に,このいわゆる「反転可能性スコア」のレイヤーが重ねられた.「反転可能性」スコアの高い複数の選挙区をメディアマーケットが報道すると,それによってランキングが跳ね上がる.すると,アルゴリズムは価格情報を取り込み,「反転可能な」有権者たちがいちばん見そうなTV番組を予測し,どの枠を買うか判断する.

どこが皮肉かって? 大統領選に勝つために多くの問いがたてられ,多くのデータが収集され,多くのランダム対照実験が実施されている一方で,大統領選で政策を選ぶためにはこれほどのことがなされはしないだろうってところだよ.やれやれ.

Total
0
Shares

コメントを残す

Related Posts