1 minute read

ジョセフ・ヒース「アメを与えるな、ムチを打て！：『資本主義が嫌いな人のための経済学』未収録原稿より」

保守派の見解には１つ、深刻な問題点がある。罰は、多くの人が思っているほど効果的でないのだ。実際に刑罰の行使に携わる人々が、リベラルな立場に傾きがちなのはこのためである。

ロナルド・レーガンはかつてこう述べた。「リベラルにとって『犯罪に厳しくあたる』というのは、犯罪者の執行猶予を長くすることなのだ」と ^[1] … Continue reading 。誰もがこの発言を愉快に感じたわけではなかったが、ここでレーガンが述べている、保守派とリベラル派の気質の違いというのは誰もが理解していた。右派と左派、保守派とリベラル派の根深い対立点の１つは、罰の行使に関わっている。保守派は、罰によって他人に言うことを聞かせたがる。生意気なガキはぶたなきゃ直らないし、反抗的なティーンエイジャーは軍隊の訓練所に放り込むべきだ。薬物中毒者は刑務所に閉じ込め、犯罪者の刑期は長くし、テロリストはひっ捕らえて殺さなければならない。リベラルはというとその反対で、ルールに違反した者を甘やかし慰められる機会をいつも探している。生意気な子どもはちょっとイラだっているだけなのだから、もっと彼らの言葉に耳を貸してやらないといけない。ティーンエイジャーにはバスケットボールのコートをもっと与えて、放課後のプログラムも増やすべきだ。薬物中毒は病気であり、必要なのは安全な注射施設（セーフ・インジェクション・サイト）だ。犯罪者には罰を与えるのではなく社会復帰の手伝いをすべきだし、テロを防ぎたいなら国外支援をもっと増やすべきである。

保守派は大抵、リベラルのこうした気質が、過剰な潔癖さ、ないしは道徳的な混乱に基づいていると見なす。そして実際のところ、そうした傾向は確かに見られる。例えば、「楽しいことが大好き」なアメリカ人の青年、マイケル・フェイが、スプレーで車に落書きしたことでシンガポール警察に捕まり、鞭打ちの刑を宣告された際のことを思い出してみよう。アメリカ人たちはこのニュースを受け、大変に恐れおののいた。当時のアメリカ大統領、ビル・クリントンが寛大な処置を求めて個人的に介入したことで、この件は国際問題にまで発展した。だが、短時間で終わる鞭打ちと、犯罪者を何年も刑務所に収監するという仕打ちのどちらがマシかというのは、全く明らかではない。少なくとも、死刑に比べればはるかにマシだ。冤罪で捕らえた人を鞭で打っても、後で謝ることができるのだから。実際、身体刑に対する私たちの潔癖さは、より巧妙な心理的拷問の発明を促しているに過ぎないことがしばしばである ^[2]原注：この仮説を展開したものとして最も有名なのは、ミシェル・フーコーの『監獄と誕生』である。。

とはいえ、リベラルがこの点で行き過ぎているとしても、保守派の見解には１つ、深刻な問題点がある。罰は、多くの人が思っているほど効果的でないのだ。実際に刑罰の行使に携わる人々が、リベラルな立場に傾きがちなのはこのためである。刑罰を行使する現場で働いていると、罰だけに頼るやり方が全く上手くいかないということをまざまざと思い知らされるのだ。例えば、カナダのいわゆる「フェイント・ホープ」条項について考えてみよう。この条項によって、無期懲役の判決を受けた大量殺人犯すら、一時的に仮釈放を申し立てる機会が与えられる。何人もの子どもを殺して有罪となったクリフォード・オルソンが仮釈放審査を認められたというニュースが流れると、カナダでは数年おきに大変な怒りが巻き起こる。オルソンの仮釈放は毎度棄却されているが、仮釈放が検討されたというだけでも、保守派を激怒させるには十分である。それでも、フェイント・ホープ条項は根強く支持され続けている。それも、犯罪者は世間から誤解されているだけだと考える心優しい社会学者たちだけが支持しているのではない。カナダ矯正局（Corrections Canada）、すなわち刑務所の所長や看守たちもまた、この条項を強く支持しているのだ。というのも、ムチだけ打ってアメを完全に取り上げてしまうと、一部の受刑者は全く言うことを聞かなくなってしまうのである。多くの場合、たった１つのかすかな、ありそうもない希望の糸でも、それを奪ってしまえば、どれほど罰を与えようと埋め合わせることはできない。

しかし、私たちはこの事実を無視しがちだ。なぜか。人間みなが抱えている認知的誤謬のせいで、正の強化〔良い行動に報酬を与えること〕は上手く働かないと思い込んでしまうからだ（実際には上手く働く場合でも）。このバイアスは大変広く見られ、そのせいで私たちは罰の実効性を過大評価することになる ^[3]原注：Norman Miller; Donald C. Butler; James A. McMartin, “The Ineffectiveness of Punishment Power in Group Interaction,” Sociometry, 32 (1969): 24-42。。これは、「平均への回帰」という統計現象のせいだ。平均への回帰というのは簡単に言うと、「稀にしか起きない出来事が起こった後は、稀にしか起きない出来事よりも、ありふれた出来事の方が起こりやすい」ということだ。そのため、たいへん悪い行動の後は、それよりも良い行動が続きやすく、たいへん良い行動の後には、それよりも悪い行動が続きやすい。このパターンは、悪い行動が罰されたり、良い行動が報われたりすることとは関係なく生じる。しかし、普通に観察しているだけだと、根底にあるパターンに気づけず、「罰は上手く働くが、報酬は上手く働かない」と勘違いしてしまうようになる。それどころか、報酬を与えることで悪い行動が促される、と思い込んでしまう。これが「回帰の誤謬」だ。残念ながら、回帰の誤謬から逃れる唯一の方法は、長期的なトレンドに目を向けることだ。そのため、罰の効き目に関しては、長期的なトレンドを観察する専門家の意見と、常識が導く判断との間に大きな相違が生じることとなる。

平均への回帰

統計を理解している人は、統計を理解していない我々のような人間の発言を聞いて日々イライラしているようだ。とある同僚は、通勤電車で地元のコミュニティ・カレッジの広告が目に入る度に不愉快になる、とひどくイラだっていた。その広告の内容は、「卒業生の90％が卒業後１年以内に就職しています」というものだった。「ベースレートの無視！」と彼女は叫んだ。「これはベースレートを無視してる！　卒業生の90％が就職？　でも今の失業率は５％。このコミュニティ・カレッジに通うと失業する確率が倍になるの？　それとも、このカレッジに行くのは負け組だけってこと？」。

「回帰の誤謬」は、今見た「ベースレートの誤謬」と比べるともうちょっと分かりにくい。ある人がそこそこ難しいタスクを行おうとしている場面を考えてみてほしい。具体的なイメージを持つために、私を例にしよう。同世代の人間の多くと同様、私は「反射神経（twitch）」系のビデオゲームで育ち、今でもそれをやめられずにいる。残念ながら、私も年を取ったので（それと、インターネットの驚異もあり）、14歳のヒットスキャン厨に撃たれるという屈辱を味わう機会も増えてきた。そこで私は、しぶしぶ反射神経テストを受けてみることにした。加齢によって自分の能力がどれほど衰えたかを確かめたかったのだ。インターネットにはこの手のサイトがいくらでもあるが、私が選んだのは、全ユーザーの人口統計的情報を収集しているサイトだった（このサイトは、同じテストを受けた何千ものユーザーの集計データを、年齢、性別、その他の項目に分けて表示してくれる）。テストを受けてみたところ、私の反射速度は依然として、11歳から20歳のほとんどのユーザーよりも速いということが分かり、私は安堵した。

このテスト自体は非常にシンプルなものだ。画面に表示された信号機をじっと見つめ、信号が赤から青に変わった瞬間にマウスをクリックするのである（ただし、赤から青に切り替わるタイミングはバラバラだ）。すると、反応時間がミリ秒単位で表示される。きちんと平均値をとるため、私はこのテストを100回繰り返して、そのスコアを記録した。その成績をグラフにプロットすると、現れたのはおなじみの、釣り鐘型の「正規分布」曲線だった（図3.1）。この図において、横軸は反応時間（ミリ秒）、縦軸はその速度で反応できた回数を示している。100回の試行のうち27回は、反応時間が230～250ミリ秒の範囲に収まっており、これが曲線のピークとなっている。210～230ミリ秒の反応はやや頻度が下がり（25回）、250-270ミリ秒の反応も同様に頻度が下がっている（20回）。さらに外側を見ると、200～210ミリ秒の反応が13回あるが、その他は非常に速いか非常に遅い反応が、それぞれ十数回ほど見られた。中には、ボケっとしていたせいで反応が極端に遅くなったものもいくつかあった（そのため、右側に「ロングテール」ができている）。

このグラフから何が分かるだろうか？　まず分かるのは、私の反射神経だと、200～270ミリ秒の反応時間になる確率が非常に高いということだ。100回の試行のうち85回がこの範囲に収まっている。このテストをもう１回行うとして、そのスコア予想で賭けをするなら、200から270の間の数値を選ぶのが安全策だ。100回の試行における平均値は241ミリ秒で、これは最頻値の234ミリ秒よりもやや高い数値となっている。なぜこうなるかというと、反応時間の分布がやや右の方に偏っているからである。なぜ右に偏るのかというと、反射神経テストでは、速く反応しようとしても限界がある一方、反応が遅い場合はどこまでも遅くなれるからだ。そのため、「非常に速い」外れ値はそこまで速くならない一方、「非常に遅い」外れ値は大変に遅くなる。

しかしながら、このグラフからは読み取れないことが１つある。それは、私の反応のパターンだ。図3.2を見てほしい。この図において、横軸は100回の試行を、縦軸は各試行における反応時間を示している。このグラフによって、スコアの推移が見えてくる。ここでも案の定、ほとんどの試行は234ミリ秒という最頻値の周辺に集まっている。ときたま生じる急上昇や急降下は、非常に速い反応と非常に遅い反応を示しているが、これらの「外れ値」同士は互いに距離が離れている。

非常に遅い反応（270ミリ秒以上）を見ると、どれをとっても、その直後に非常に遅い反応が連続して起こるということはない。これは、非常に速い反応（200ミリ秒以下）についても同じだ。理由は単純。図3.1から見て取れるように、私の反応が200～270ミリ秒に収まる確率は85％だ。ある試行で反応時間がこの範囲の外に出る確率は15％だが、２回続けてこの範囲外になる確率はずっと低くなる（2.25％）。実際、100回の試行において２回連続で200～270ミリ秒の範囲を出たことは一度もなかった。非常に良いスコアと非常に悪いスコアが尖った形で（急上昇と急降下として）現れているのはこのためだ。

「平均への回帰」というのは、非常に悪いスコアや非常に良いスコアが出ると、その直後のスコアは平均により近くなりがちである、という現象を指す言葉だ。これは「心理法則」とはなんの関係もなく、「確率法則」のために生じる現象である。低確率な事象が起こった後は、低確率な事象よりも高確率な事象の方が置きやすい。それは単純に、高確率な事象は低確率な事象よりも生じやすいからだ。「よくあることはよく起こる（common things are common）」とことわざにも言う通りである。私の反射神経テストの例で言うと、悪いパフォーマンスの後には、常にそれよりも良いパフォーマンスが続いている。それは、悪いスコアが出たことで反省して、良いパフォーマンスを出そうと決意したからでも、ひどいスコアが出たことで集中力が高まったからでもない。単純に、悪いパフォーマンスは平均から大きく逸脱しているので、そもそも起こりにくいというだけだ。結果、悪いパフォーマンスの直後はパフォーマンスが改善することになるが、それは単に、改善の方が（いつ起こるかに関係なく）それ自体として起こりやすい事象であるからに過ぎない。同じ理由で、とても速く反応できた場合、その直後はそれよりも遅い反応時間になる。よくあることはよく起こるのだ。

ここで、この反射神経テストにちょっとした「罰と報酬」の仕組みを導入して、私のパフォーマンスが向上するかどうか見てみよう。反応時間が300ミリ秒を超えるたびに、小さめの電気ショックが私に与えられる。逆に反応時間が200ミリ秒以下だと、スナックが報酬として与えられる。さて、この罰と報酬のシステムは完全に無意味だと想定してみよう（この想定は恐らく現実的だ。ビデオゲームを20年間もプレイするというのは、マウスの高速クリックに対するオペラント条件付けとしては、ほぼ最長期間にあたるだろう〔そのため、今さら罰と報酬を導入したところで反応時間が変化するとは思えない〕）。あるいはお好みなら、私は実際には罰も報酬も与えられていないが、私を横から見ている観察者は、罰や報酬が与えられているかのように思い込まされている、と想定してもよい（ミルグラム実験のように）。問題は、このとき、罰と報酬がどんな効果を持つように見えるか、である。

図3.3は、先ほどのスコアの推移のグラフに、罰と報酬を示す線を重ねたものだ。上の横線は、それよりも上になると罰が与えられる閾値を、下の横線は、それよりも下になると報酬が与えられる閾値を、それぞれ示している。この図において私は、100回の試行のうち２回報酬を与えられ、６回罰を受けている。さて、このシステムの「インセンティブ効果」を見てみると、罰は上手く機能しているように見える。なんだかんだいって、罰が与えられる度にスコアが改善しているからだ。それに対して報酬はというと、上手く機能していないどころか、逆効果になってしまっているように見える。報酬が与えられる度、私のパフォーマンスは悪化しているためだ。なぜこうなるのかと言えば、速い反応の後には遅い反応が続きやすいからである。ご存知の通り、罰と報酬を導入したせいでこうなっている、というのは全くの幻想だ。この現象は平均への回帰によって引き起こされている。だが、この図を見ると、罰も報酬も一定の効果を持つように見えてしまう。罰と報酬では、その後に続くスコアが異なってくるからだ。

罰と報酬がどう働いているかを実際に見分ける唯一の方法は、長期的なトレンドに目を向け、平均的なパフォーマンスが改善したかを確認することだ。ここでも、注意深く観察しないと間違った結論に陥りやすい。図3.3では、罰を加えた後にパフォーマンスが改善するケースが多いため、罰によって平均的なパフォーマンスが改善したと勘違いしてしまいがちだ。反応時間が非常に遅くなる頻度は下がっているようにも見る。だが実際には、私の全体的なパフォーマンスは100回の試行を通して徐々に悪化している。平均的に見て、反応時間は遅くなっているのだ。このことに気づくためには、結果を定量的に、注意深く吟味する必要がある（つまり、「エクセルに傾向線をプロットさせないといけない」）。

だが私たちはほとんどの場合、個人のパフォーマンスのデータを長期的に集めるなんてことはしない。そのため、私たちが頼れるのは個人的な印象だけだ。しかし、平均への回帰が存在するため、こうした個人的な印象はほぼ常に間違った結論を導く。

ムチは効くが、アメは効かない？

私は大学教員なので、罰と報酬を与える仕事には馴染みがある。毎年、労働時間のかなりの部分を学生の成績評価に費やしているからだ。成績評価は、いささか分かりにくくなっているとはいえ、基本的に罰と報酬のシステムである。人文学の授業において、成績評価のシステムは非常にシンプルだ。課題を真剣にやった者なら、誰でも単位は取れる。問題はどんな成績をつけられるかだ。普通の学生からすると、C評価は罰であり、A評価は報酬だ（B評価は中立である）。C評価をつけられたせいで医学部に行けなくなったと泣き叫ぶ学生に何人かでも遭遇すれば、成績評価とは学生に罰や報酬を与えることなのだ（電気ショックを与えたりお菓子をあげたりするのとそう変わらないことだ）と嫌でも気づくことになる。

成績評価をつけ始めて数年も経つと、ある傾向が存在することに気づきだした。最初の課題でC評価を食らった学生の多くは、その学期を通じて成績が顕著に改善していく。つまり、そうした学生はC評価という罰を食らって「気を引き締め」、勉学に真剣に取り組むようになったのだ。一方、最初の課題でA評価をもらった学生の多くは、成績が顕著に低下していった。つまり、A評価をもらったことで、サボってもよいと考え、楽な道を選ぶようになったのだ。あるいはもしかすると、この授業はどんどん簡単になっていくと勘違いして、真剣に励まなくてもよいと思い込んでしまったのだろうか？　いずれにせよ、最初の課題で良い評価をつけることはその学生のためにはならない、ということは明らかに思われた。

時が経つにつれ、成績評価のインセンティブ効果に関する私の理論は、非常に洗練されたものになっていった。この理論によれば、学生に低い評価をつけることは、大変有益な効果を持つということになっていた。残念ながら、私の理論は100％完全に、回帰の誤謬に基づくものだった。私は、ほとんどの学生はBレベルなのであり、そうした学生が提出する課題のほとんどにはB評価がつく、という事実を無視していたのだ。単純に、ほとんどの学生の課題の質はBレベルなのである。もちろん、Bレベルの学生がときおり、ひどい課題を提出してきたり、素晴らしい課題を提出してきたりすることはある。だが、その後の課題ではすぐに「元に戻り」、平均的なレベルの課題を提出するようになりがちだろう。そのため、C評価を与えられた学生の成績が改善を見せ、A評価を与えられた学生の成績が悪化していくのは自然な成り行きなのだ。学生たちが自分の成績を全く知らされていなかったとしても、そうなる。

「平均への回帰」を紹介する文章を読むまで、私は自分がこの現象に騙されていると悟ることができなかった。恥ずかしながら、私が「平均への回帰」について知ったのは、教員向けのマニュアルでも、社会心理学の論文でもなく、犬のトレーニング教本を読んでいるときだった ^[4]原注：The Monks of New Skete, The Art of Raising a Puppy (New York: Little, Brown & Co., 1991)。。その教本では、正の強化〔良いパフォーマンスに対して報酬を与えること〕が実際には最も有効なトレーニング戦略であるにもかかわらず、なぜ飼い主の多くが犬を叩いてしまうのか、ということが説明されていた。問題は、罰や報酬の効き方に関して飼い主側が持っている認識が、大抵の場合間違っているということだ。とりわけ、萎縮した行動をやめさせようとする場合、罰の力を過大評価すると悲惨な結果になる。負の強化〔悪いパフォーマンスに対して罰を与えること〕によって、萎縮した行動を取り除くのは実際には不可能だからだ。むしろ、罰はそうした萎縮行動をいっそう促してしまうだけである。

回帰の誤謬がいっそう深刻なのは、世界が回帰の誤謬（罰は効果的であるという印象）を生み出すような仕方で成り立っているだけでなく、罰が効果的だと考えることで報われるような仕組みになっていることだ。これもまた、大学教員をしていればよく分かる。私は、多くの教員と同様、学生には良い成績であってほしいと思っている（少なくとも、学生の成績が良ければ、私が良い仕事をしていることの証拠になる）。だから、学生のパフォーマンスが落ちればがっかりするし、パフォーマンが上がれば嬉しくなる。そのため、学生に低評価をつけると、その学生の成績評価はその後改善しがちだから、私としては嬉しくなる。逆に、学生に高評価を付けると、その学生の成績評価はその後下がりがちだから、がっかりしてしまう。ダニエル・カーネマンの次の文章は、この現象を完璧に要約している。「人は、他人が良いパフォーマンスをあげると報酬を与え、悪いパフォーマンスだと罰を与えがちだ。そして、平均への回帰という現象が存在するため、私たちは統計的に言って、他人に報酬を与えることで罰を受け、他人を罰することで報酬を得られる。これが、人間の置かれた条件の１つなのだ」 ^[5]原注：ダニエル・カーネマンによるノーベル賞での自伝的講演より〔『カーネマン経済と心理を語る』pp. 86-87。ただし訳文は一部改変。〕。。言い換えると、この世界は、他者を褒めるのではなく他者を罰するよう、私たちを条件付けしているのである。

ギャンブラーの誤謬

回帰の誤謬は、いわゆる「ギャンブラーの誤謬」と区別する必要がある。回帰の誤謬は、ある結果が他の結果よりも生じやすい、という事実を無視することで生じる。一方、ギャンブラーの誤謬は、ある結果が他の結果よりも生じやすいわけではないのに、生じやすいと考えてしまうことで生じる。ギャンブラーの誤謬にはまっている人を実際に見たければ、近所の宝くじ売り場に行ってみるとよい。そして、自分で数字を選ぶタイプの宝くじ（ロト）を買って、１２３４５６などの極端に「規則的」な数字の列を選んでみるのだ。店員はこう言うだろう。「そんな風に数字が順番通りに出る確率なんて、どれくらいあると思います？」。あなたはこう答えればいい。「どんな数字の列が出る確率も等しく同じですよ」。

ロトくじではどんな結果も等確率であるため、あらゆるベットは等しく良い賭けとなる。例えば、先週の当選番号通りの数字を選ぶことは、他の数列を選ぶよりも良い賭けにはならないが、悪い賭けにもならない。同じことはスロットマシンにも言える。しばらく当たりが出ていない台は、他の台よりも当たりが出やすくなっている、ということはない。だが、クラップス（２つのサイコロの出目の合計で競うゲーム）の場合は事情が異なる。クラップスの場合、ある結果は他の結果よりも生じすくなっているからだ。２つのサイコロを振ったとき、その出目の合計がどんな数字になるかは、等確率ではない。合計が７になる出目の出方は６通りある（(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)）が、合計が11になる出目の出方は２通りしかない（(5, 6), (6, 5)）。そのため、７は11よりも出やすくなる ^[6]原注：Huygens, On Ratiocination in Dice Games。。よって、11が出た後で７が出る確率は、もう一度11が出る確率よりも高い。それは、そもそも７の方が11よりも出やすいからだ。要するに、サイコロの出目の合計は平均へ回帰するのである。だがここで、11が出たことによって７がより出やすくなったとか、11がより出にくくなった、と勘違いしてしまわないことが重要だ。稀な結果が出た後によりありふれた結果へ回帰していくというのは、因果関係を記述しているわけではない。それは単に、背景確率が全ての結果に関して同じではない場合に生じがちなパターンを記述しているだけだ。

それゆえ、重要なのは、ギャンブラーの誤謬に陥ることなく、平均への回帰に基づいて予想を立てることだ。コインを10回投げて10回連続で表が出たとしても、それによって次のコイントスで表が出やすくなるとか出にくくなるとかということはない。11回連続で表が出る確率は非常に低いが、10回連続で表が出た後、11回目のコイントスで表が出る確率は、依然として50％だ。つまり、同じ結果が連続で出続けているという事実は、その連続記録が終わる確率を高めはしないのである（そして、連続記録が継続される確率を高めもしない）。同じことは平均への回帰にも言える。クラップスのプレイヤーが10回連続で「11」を出した場合、次の回では11よりも７が出る確率の方が高い。だがそれは、「11」が10回連続で出ているという事実とはなんの関係もない。単純に、クラップスにおいて７は11よりも常に出やすいというだけだ。

そのため、回帰を予測することばかりに集中してもいけない。例えば、アクティブ運用の投資信託〔ファンドマネージャーが市場平均を上回ることを目指して戦略的に運用する投資信託〕のほとんどは市場平均を上回ることができず、インデックス型などのパッシブ運用の投資信託〔特定の指標と連動するよう機械的に運用される投資信託〕より成績が悪い。そして、運用成績がランダムである限り（つまり人間の知的能力によって運用結果が左右されない限り）——通常はそうなる——、ある年に極めて良い成績をあげたファンドは、翌年の成績が悪化する可能性が高い。そのため、過去の実績を見てファンドを選ぶのはそれほど優れた投資戦略とは言えない。だが、それほど悪い投資戦略でもない。あるファンドマネージャーがある年に運よく成功したという事実は、翌年も運よく成功する確率を低くするわけではないからだ。前年と同じような成績をあげられる可能性は低いが、市場平均を上回る可能性は、それ以前と全く同じくらいある。ファンドを選ぶ基準を特に持ち合わせていないなら、過去の実績に基づいてファンドを選んでも構わない。それは実質的にランダム化戦略となるからだ。とはいえ、失望を避けるためには、選んだファンドの過去の成績ではなく、似たようなファンドの平均的な成績を見て、期待を形成すべきである。

罰は必要だが、罰だけでは上手くいかない

人は一般に（そして経済学者はとりわけ）、「外発的」動機、あるいは外的インセンティブが個人の行動に及ぼす影響力を過大評価する傾向にある〔この点は本書『資本主義が嫌いな人のための経済学』の第２章「インセンティブは重要だ」で取り上げられている〕。この認知バイアスが「回帰の誤謬」と組み合わさると、外的インセンティブを与える手段としての罰の有効性がひどく高く見積もられるようになる。その結果、一部の人々は、非常に刺々しい、冷酷とすら言ってもいいような道徳的気性を持つようになってしまう。

例えば、保守派が提示してきた次のような洗練された仮説について考えてみよう（この仮説はアメリカによるイラク侵攻の前夜、ロバート・ケーガンによって力強く展開された）。国際秩序を安定させているのは、究極的には、軍事力による脅威だけだ ^[7]原注：ロバート・ケーガン『ネオコンの論理』。。この見解によると、外交努力や「建設的な関与」が対外政策において重要だとするヨーロッパ人の考えは、単なる思い込みに過ぎない。ケーガン曰く、この幻想が成り立っているのは、ヨーロッパの外交努力（「ソフトパワー」）がアメリカの軍事力（「ハードパワー」）に裏で支えられているからだ。もちろん、この「アメをやるな、ムチを打て」という外交アプローチ（イラクやその他の国でアメリカが展開してきたやり方）がどういう結果をもたらすかは、完全に予測可能であった。実際、国際関係を冷静な視点で捉えていた人々はみな、この結果を予測していた。蓋を開けてみれば、アメは貧者がムチの代わりに用いるものではなく、多くの場合、優れた外交政策上の道具であった。だからこそ、EUは過去20年、民主主義の促進においてアメリカよりもはるかに成功してきたのだ（EUへの加盟をアメにして）。

もちろん、ここで逆の極端に走ってしまうのも避けるべきだ。つまり、罰や強制が社会的コントロールのメカニズムとして完全に不要だなどと考えてしまうべきではない。保守派はリベラルが罰に対して潔癖すぎると非難するが、こうした傾向は私たちの文化において確かに存在する。確かに、集合行為〔いわゆる「囚人のジレンマ」〕のゲーム実験を行うと、フリーライドしても罰が与えられないという状況でも、３分の２の人々は自発的に協力する。この結果は、罰や脅威は通常思われているほどの重要性を持たない、ということを示している。とはいえ、平均で３分の１の人々は協力を選択しない、ということを忘れてはいけない。ゲームを繰り返すと、こうした裏切り者の存在はあっという間に協力を崩壊させる ^[8] … Continue reading 。理由は単純で、最初に協力することを選んだプレイヤーは、他のプレイヤーがフリーライドを選んで罰されずに済んでいるのを目撃すると、協力をやめる可能性が高くなるからだ。「あいつが協力しないなら、なんで自分が協力しないといけないんだ？」というわけである。集合行為ゲームで協力を維持する唯一の方法は、プレイヤーたちがプレイする戦略に一定の「相関」を生み出すことだ。つまり、協力的なプレイヤーは他の協力的なプレイヤーと遭遇しやすく、裏切りプレイヤーは他の裏切りプレイヤーと遭遇しやすくなっていなければならない。これが現実に意味するところはこうだ。協力的なプレイヤーは、裏切りプレイヤーを追放するか、あるいは協力の利益へのアクセスから締め出すことによって、裏切りプレイヤーを罰することができる必要がある。

そのため、協力の利益へのアクセス（集合行為ゲームにおける「アメ」）は、ほとんどの人を協力へと動機づけるのに十分だが、それでも協力を維持するにはこれだけでは足りない。協力的にふるまわないプレイヤーに対して「ムチ」を打つ選択肢が与えられない限り、協力のシステムはすぐに崩壊する。こうしたケースにおいては罰の存在が重要になる。それは、単に裏切り者に対して協力的にふるまうよう動機づけるのに役立つからではない。既に協力的なプレイヤーたちが、裏切り者に食い物にされることなく安心して協力的にふるまえるようにするからだ。この点で、道徳と不道徳の間には重要な非対称性が存在する。裏切りは協力を腐敗させていくが、その逆は成り立たないのだ（文明がときに野蛮に出すことはあっても、その逆が生じることがないのはそのためだ）。罰が必要なのは、不道徳な人々が道徳的な人々を食い物にするのを防いで、道徳が繁栄できるような保護区を作り出すためなのだ。

そのため、真正の社会的逸脱をコントロールする上で懲罰的なスタンスをとることが、「反自由主義」的だったり右翼的であったりするということはない。イギリスでブレア政権が「反社会的行動」に強硬な姿勢をとったことは、この好例だ。イギリスでちょっとでも時間を過ごしたことのある人なら、公共空間での破壊行為やハラスメント、下品なふるまいが実際に問題となっていることは知っているはずだ。こうした行動は直接的には、犯罪化すべきだと言えるほど有害な帰結をもたらすわけではない。一般市民が真に懸念しているのはむしろ、その間接的な帰結、すなわち、こうした行動によってもたらされる一般的な治安の低下なのだ。深夜、道に停めた車のボンネットの上をティーンエイジャーたちが跳んだり跳ねたりしていれば、誰だって車を移動させたくなる。実際にはなんの被害も生じていなくても、その行動を止めさせるために警察を呼んでよいはずだ。

皮肉にも、罰の最も重要な社会的機能は、それが与えるインセンティブではなく、それが送るシグナルにあることが多い。刑罰は、ある種の行為が単に望ましくないだけでなく、絶対的に禁じられている、というメッセージを伝える手段だ。刑罰を課すことによって、「社会」は単にその行為を思い留まらせようとしているだけでなく、強制的にそれを防ごうとしている、ということが明確に示されるのだ。それゆえ、イギリスにおける「反社会的行動命令」、通称ASBOには意義がある（ASBOは、警察や治安判事が、特定の個人に対して迷惑行為をやめるよう命じ、違反者に対して刑事罰を課すことを可能にする制度だ）。公共利益を追求するような社会を成立させるには、人々が公共空間で快適かつ安全に過ごせることが不可欠だ。こうした基本的な事実にもかかわらず、そしてイギリスにおいてASBOが圧倒的な支持を得ているにもかかわらず、左派の多くは依然として、都市部で見られるような、継続的かつ軽微なハラスメント行為の禁止をひどく不愉快に思い続けている。

では結局、私たちは罰に対してどういう立場をとればいいのだろうか？　罰の有効性を過大に見積もることは簡単だ。また、強制をひどく不愉快に感じて、罰を必死で敬遠することも簡単である。正しいアプローチは恐らく、その中間にある。社会的コントロールは、科学ではなく技芸だ。私たちが望める最大限は、健全なプラグマティズム、そして、利用可能な制度的戦略の「道具箱」にあるどんなアイテムも試してみて、結果がダメなら潔く捨てるという態度だろう。

〔本エントリはジョセフ・ヒース教授が自身のウェブサイト上で公開している『資本主義が嫌いな人のための経済学』の没原稿であり、ヒース教授の許可に基づいて翻訳・公開している。
未収録原稿は『もっと民主主義を進めよう！』もあり。〕

ジョセフ・ヒース「もっと民主主義を進めよう！：『資本主義が嫌いな人のための経済学』未収録原稿より）

[Joseph Heath, Spare the rod, spoil the child, Filthy Lucre manuscript.]

寄付のお願い

↑1	原注：これは、ハリウッド映画のセリフの真似である。1972年に公開されたロバート・レッドフォード主演の風刺映画「候補者ビル・マッケイ」からとられたセリフだ。
↑2	原注：この仮説を展開したものとして最も有名なのは、ミシェル・フーコーの『監獄と誕生』である。
↑3	原注：Norman Miller; Donald C. Butler; James A. McMartin, “The Ineffectiveness of Punishment Power in Group Interaction,” Sociometry, 32 (1969): 24-42。
↑4	原注：The Monks of New Skete, The Art of Raising a Puppy (New York: Little, Brown & Co., 1991)。
↑5	原注：ダニエル・カーネマンによるノーベル賞での自伝的講演より〔『カーネマン経済と心理を語る』pp. 86-87。ただし訳文は一部改変。〕。
↑6	原注：Huygens, On Ratiocination in Dice Games。
↑7	原注：ロバート・ケーガン『ネオコンの論理』。
↑8	訳注：ゲーム理論において、囚人のジレンマの無限回繰り返しゲームでは（一定の条件付きで）協力が均衡の１つとなる。だがゲーム実験で繰り返しゲームを行うと、罰なしでは協力率が低下していくことが確かめられている。例えば、リチャード・セイラー『セイラー教授の行動経済学入門』第2章を参照。

The Latest

ピーター・ターチン「我にエアコンを、汝には与えず：ヨーロッパは未だ封建社会である」（2026年7月1日）

ジョセフ・ヒース「ハラリ vs ヘンリック：人間の進化について科学が実際に語っていること」（2026年6月13日）

ジョセフ・ヒース「アメリカは政治制度のバグに真剣に向き合う必要がある：トランプを追い出すだけでは問題が解決しない理由」（2026年4月1日）

ジョセフ・ヒース「もっと民主主義を進めよう！：『資本主義が嫌いな人のための経済学』未収録録原稿より）

ジョセフ・ヒース「アメを与えるな、ムチを打て！：『資本主義が嫌いな人のための経済学』未収録原稿より」

いいね:

平均への回帰

ムチは効くが、アメは効かない？

ギャンブラーの誤謬

罰は必要だが、罰だけでは上手くいかない

いいね:

関連

コメントを残すコメントをキャンセル

ジョセフ・ヒース「アメを与えるな、ムチを打て！：『資本主義が嫌いな人のための経済学』未収録原稿より」

共有:

いいね:

平均への回帰

ムチは効くが、アメは効かない？

ギャンブラーの誤謬

罰は必要だが、罰だけでは上手くいかない

共有:

いいね:

関連

コメントを残すコメントをキャンセル

Related Posts