サミュエル・ハモンド「我々は今や皆、ウィトゲンシュタイン主義者だ:大規模言語モデル(LLM)は哲学的問題を解決する」(2023年3月21日)

人工知能の開発は、科学的・工学的な営為であると同時に、哲学的な営為でもある。人間の脳の特権的領域と考えられていた能力が、人工知能によって実現されれば、心の哲学での長きにわたる論争が、完全に解明されないにしても、大幅に解決される可能性があるからだ。

人工知能の開発は、科学的・工学的な営為であると同時に、哲学的な営為でもある。人間の脳の特権的領域と考えられていた能力が、人工知能によって実現されれば、心の哲学での長きにわたる論争が、完全に解明されないにしても、大幅に解決される可能性があるからだ。

そして、「脳」は、我々の世界への認知・接触手段となっているため、心の仕組みへの理解が進めば、哲学のあらゆる分野(認識論からメタ倫理学まで)に光を当てることになるだろう。そして、この件において、私の見解は、ノーム・チョムスキーとは正反対だ。チョムスキーは、大規模言語モデル(LLM)の成功からの、科学的・哲学的な成果は限定されるだろうと主張している。彼に言わせると、なんらかの成果があったとしても、それらは最終的には巨大な不可解さのタコツボ群に還元されてしまうとのことだ。チョムスキーの見解に反して、「巨大な不可解さのタコツボ群」でも、適切な状況に配列されれば、生物学的な脳で必要とされている多くのことができる、という発見自体が、驚くべき実証的与件なのだ。チョムスキーは、実証的発見を、先験的に批判している。

生物学的な脳は、人工的なニューラルネットワークとは重要な点で様々に異なるが、後者が前者の能力を模倣できるという事実こそが、人間の自己理解に大きく貢献するのである。貢献の一つに、脳が計算機であることを、独立した証拠が明らかにしたことがある。しかし、これは貢献における氷山の一角に過ぎない。LLMの成功は、「意味とは何か」という長年の議論の決着につながるかもしれない。

ウェーイ、ウィトゲンシュタイン見てるー!

意味の哲学では、大きく分けて2つの考え方がある。「指示(reference)としての意味」と「使用としての意味」だ。

前者は、ルネ・デカルトの心身二元論と関係がある。こうした「指示としての意味」理論は、古典的な意味論であり、「主体」と「客体」の直感的な分離を出発点としている。この理論では、「ジョー・バイデンは80歳である」といった文は、「ジョー・バイデン」という固有名と、その名前が示す物理的な人物との対応のように、言葉と客観的な世界との間の真理条件的な対応関係によって意味を持つとされる。

20世紀初頭、論理実証主義たちは、このアプローチを採用し(推し進め…)論理的な帰結を導こうとした。例えば、バートランド・ラッセルは、『論理的原子論の哲学』で、「論理的な理想の言語」を構築しようとしている。そこでは最小の実行可能な叙述(predicate)を、世界について等しく対応する原始的な事実と対応させる試みが行われた。この言語への分子論的アプローチによって、言語哲学者は、文や命題の意味を、個々の単語であっても、論理学的存在記号(existential quantifier)のような純粋な論理的目的語であっても、それらを構成要素から構築されたものとして扱おうとしたのである。ウィトゲンシュタインは『論理哲学論考』で、「命題とは、世界との投射関係における命題記号である」と述べた。

意味を指示(reference)として受け入れることは、すぐに奇妙な状況に行き着いた。例えば、論理実証主義であるA.J.エアは、「慈善は善(Charity is good)」のような文は、文字通り無意味だと結論付けた。なぜなら、「良いこと(goodness)」は、検証しようにも、外界において明確な指示対象(referent)を欠いているからである。道徳的・美的な命題は、純粋に情緒的なものであり、「慈善はいいぞ!」と言うようなものである〔訳注:エアは、倫理的判断は情緒的直感に基づいているため、外界に指示対象を持たないと批判した〕。ポスト構造主義者は、記号と記号化されたもの(たとえば、言葉と、その言葉を構造している任意の文字や音素)の関係は、不可避的に自己言及的とまではいかないにしても、不安定となることが多いと指摘し、この問題からさらに一方踏み込んだ。これに、脱構築主義や、意味そのものへの懐疑主義が続いた。ニヒリズムを恐れ、存在論的な実在を自然種(natural kinds)として位置づけ、「意味」を救済しようとする論者もいた。例えばこの〔自然種的な〕立場では、「椅子」という言葉の意味は、普遍、つまりプラトン主義的な椅子と対応することで、存在していることになる。

意味の指示理論が、懐疑論とプラトン主義の両極端の間で揺れ動いたことは、最終的に哲学者を別の方向に向かわせた。この方向転換には、ウィトゲンシュタインも含まれており、彼は後年になって、実証主義的なプロジェクトは不可能であることに気づいたのである。それに代わって、ウィトゲンシュタインが遺著『哲学探求』で示唆したのが、「使用」の意味理論である。

使用の意味理論では、意味論(semantic)より、発話の語用論が優先するとされる。言葉や命題は、それで何かをする限りにおいて意味を持つのである。ウィトゲンシュタインは、これは言語ゲーム(ゲームとは、他の言語使用者との社会的実践という全体的な文脈の中で生じるもの)を通して具現化されるとした。

つまり、単語を、意味における原子的対象として扱うのではなく、文脈の中において一般的な意味を持つとするのである。これは、哲学者ジョセフ・ヒースが『ルールに従う』の中で述べているように、基本的にカント的な洞察であり、言語学的転回によって更新されたものだ。

カントの『純粋理性批判』によって切り拓かれた劇的な概念上の革命は 、語と概念は適切な説明上の原基ではないかもしれないという示唆によって始められた。文全体(すなわち判断)が意味の第一の担い手であり、語の意味は、それが出現する文の意味に対して行う寄与から派生しているかもしれないというのである。(…)結局のところ文こそが、われわれが言語で何かする――主張したり、命令したり、質問したりする――ために用いる基本的単位なのである。社会的実践がどのようにして、このような表現使用に対するルールを提供しうるのか(したがって、これらの社会的実践に内包された規範がどのようにして、こうした表現に意味を付与しうるのか)を理解することは難しくない。

ジョセフ・ヒース『ルールに従う

よって、文の意味においては、〔語や概念のようなミクロの〕構成要素を元に構築されるのではなく、文全体の用法や文脈が先にあり、そこから語の意味が推測される。そのため、我々は、新しい語を学習する際には、大抵の場合でその語の文中での使用を想定しており、学習時に意味把握に苦戦した単語でも、いざとなれば適切に使用することができる。例えば、よくある言語的間違い――「あらゆる意図と目的をもって」のつもりが、「あらゆる集約的な目的を持って」としてしてしまう――もこうした理由から発生する〔訳注:“intent”「意図」と、“intensive”「集約的」は、全く別の意味の単語なのに、似たような文脈で使われることから、人はこの2つの単語を間違えて使うことが多くなってしまう。日本語でも「延々と」「永遠と」の混同にこの現象が見られると指摘されている〕。我々は、個別の語の意味と、その語の組み合わせのルールからではなく、その使い方からフレーズの意味を把握するのである。

LLMの成功は、特に自然言語処理の記号的アプローチの失敗を念頭に置いた場合、意味の使用理論の優位性を証明するものだと考えられる。機械学習モデルの設計思想(トランスフォーマー・アーキテクチャ)は、入力シーケンスのコンテキストを条件付けるための注意メカニズムを提供しており、モデルは一度に1つの語ではなく、完全な文から意味を推論することが可能となったことで、まさに決定的なブレークスルーとなった。フレーゲが、「文という脈絡においてのみ、語は何かを意味する(Nur im Zusammenhange eines Satzes bedeuten die Worter etwas)」と言ったのは、150年以上前のことだが、これは正しかったのだ。

特にLLMは、ヘーゲル、ウィルフリド・セラーズ、ロバート・ブランダムらと強い関係があり、「意味論的推論主義」として知られる、一部プラグマティストの意味論に信ぴょう性を与えている。推論主義では、表現は、他の表現との推論関係から意味が与えられると主張されており、推論は原始的な「行為(doing)」の一種だとされている。例えば、「カボチャは猫である」から「カボチャは哺乳類である」と推論することは可能だが、「カボチャは哺乳類である」から「カボチャは猫である」と推論することはできない。この猫と哺乳類の推論上における非対称性こそが、普遍性の古典的問題の根底に存在しているのだが、現在では、純粋にプラグマティズムによるポスト形而上学的な表現によって唯一可能な解釈とされている。

LLMにおける事前学習データの統計的(推論的)パターンからの、意味内容の抽出は、推論主義に他ならない。言語学者J.R.ファースの有名な言葉、「語は、その語が保持している共有関係によって理解される」というものがあるが、この原理は、現在では、機械学習の概念であるテキストマイニングの概念によって具現化されている。

ゲアリー・マーカスへのダメ出し

合成主義(Compositionality)」に執着しているゲアリー・マーカスが、人工知能に懐疑的な理由を、ここまでの議論によって理解できるだろう。合成主義の原理では、「複雑な表現の意味は、その表現の構成要素の意味と、その組み合わせ方法の関数である」とされている。マーカスは、「大規模言語モデルは、合成性を直接実装していない――という危険性を犯している」と批判している。しかし、ウィトゲンシュタインや推論主義のプラグマティストが正しいとするなら、ヒトの心は合成主義的なものではない。よって、自然言語のモデルも、プログラミング言語や数学のような合成主義的であらねばならないとするドグマは、約1世紀近く前に論理実証主義者が犯したのと同じデカルト的誤謬の繰り返しに過ぎないのである。

いうまでもなく、合成主義は、意味論的な安定性などで、解釈において多くの明白な利点を持っている。しかしながら、自然言語は、プログラミング言語とは似ても似つかないのである。自然言語はむしろ、文化進化の産物であり、絶えず変化する規範や社会的慣行から意味内容を導き出している。つまり、設計上不安定な存在なのだ。

叙述(predicate)の曖昧性という現象は、古典的な「砂山のパラドックス」(砂の山から、砂が一粒ずつ減っていく場合、どの時点で山とみなされなくなるのか?)に表れていると考えられている。ウィトゲンシュタインは、曖昧さは自然言語に普遍的に存在し、揺るぎない特徴であると考えた。実際、「胎児はいつヒトとなるのか?」といった哲学的な議論の背後にも、「砂山のパラドックス」の変形が潜んでいる。〔こうした問題には〕人は、法による明確に区切った定義を欲するかもしれないが、形而上学的な問題として踏み込めば、単純な事実に還元できない。こうした議論は、端的に日常言語の限界を示すものとなっている。

ヒトは日常言語の使用において、日々、曖昧な概念でやりくりしている。ディープラーニングモデルは、この「曖昧な概念」を、潜在的空間という概念イメージとして捉えている。潜在的空間内では、上の画像で示したように、椅子を机に差し替えることができる。この〔差し替え〕移行は、完全にスムーズで微分可能(differentiable)なため、「どの時点で椅子は椅子でなくなり、テーブルとなるのだろう?」という疑問が生じる。

この件において、ハッキリと線引できないと私は言明する。よって、自然言語を現実的なモデルにする際にも、「概念的あいまいさ」に対応しなければならない。幸いなことに、ニューラルネットワークは、この作業に十二分に応えてくれそうである。ニューラルネットワークは、我々の脳と同じような原理で動いているようだ!

We’re all Wittgensteinians now
The philosophical winners from LLMs
Posted by Samuel Hammond
2023/03/21
〔翻訳協力:田楽心(rakkoannex)

Total
0
Shares

コメントを残す

Related Posts