あなたは、人工知能が人間の言語能力を超えると思いますか? AIが人間のように自然な会話をしたり、複雑な文章を理解・生成したりする日は来るのでしょうか?

従来の言語学では、人間の言語能力は生得的で特別なものだと考えられてきました。しかし、最新の大規模言語モデルの登場により、その常識が揺らぎつつあります。

本稿では、カリフォルニア大学バークレー校心理学部のスティーブン・T・ピアンタドシ教授による論文「現代の言語モデルはチョムスキーの言語へのアプローチを反証する」の内容を紹介します。ピアンタドシ教授は認知科学や言語学の分野で活躍する研究者で、言語獲得や言語進化などの研究で知られています。

この論文は、最新の人工知能技術である大規模言語モデルの成功が、これまでの言語学の常識、特にノーム・チョムスキーに代表される生成文法理論の主張を覆すものだと指摘しています。

大規模言語モデルとは何か?

大規模言語モデルとは、膨大な量のテキストデータを学習することで、人間のような自然言語処理能力を獲得した人工知能システムのことです。代表的なものにOpenAIのGPT-3やGoogle のLaMDAなどがあります。

これらのモデルは、与えられた文脈から次の単語を予測するという単純なタスクを繰り返し学習することで、驚くほど高度な言語能力を身につけています。例えば:

  • 文法的に正しい文を生成する
  • 複雑な質問に答える
  • 要約や翻訳を行う
  • 創造的な文章を書く

など、多岐にわたるタスクをこなすことができます。

チョムスキーの言語理論とは?

一方、20世紀後半の言語学を牽引したノーム・チョムスキーは、人間の言語能力について以下のように主張してきました:

  • 言語能力は生得的で、遺伝的に決定されている
  • すべての人間は普遍文法と呼ばれる生得的な言語知識を持っている
  • 言語は思考と深く結びついており、主に自分自身と対話するためのもの
  • 言語の文法は自律的で、意味や統計的パターンとは独立している
  • 階層構造や再帰性などの言語の核となる特徴は生得的である

これらの主張は、長年にわたって言語学の主流となってきました。

大規模言語モデルが示唆すること

ピアンタドシ教授は、大規模言語モデルの成功が、チョムスキーらの主張とは相反する以下のような示唆を与えていると指摘します:

1. 文法は生得的でなくても獲得可能

大規模言語モデルは、文法に関する事前知識をほとんど持たないにもかかわらず、膨大なデータから自律的に文法を学習することができます。これは、文法が必ずしも生得的である必要がないことを示唆しています。

2. 統語と意味は統合可能

従来の理論では、文法(統語)は意味から独立していると考えられてきました。しかし、大規模言語モデルは統語と意味を統合的に扱うことで高い性能を実現しています。

3. 確率と情報理論が重要

チョムスキーは言語における確率の重要性を否定してきました。しかし、大規模言語モデルは確率的予測を中心に据えることで成功を収めています。

4. 表現は連続的でグラデーション

従来の理論では、言語規則は離散的なものと考えられてきました。一方、大規模言語モデルは連続的な表現を用いることで、より柔軟な言語処理を実現しています。

5. 制約のない空間でも学習可能

チョムスキーらは、言語獲得には強い生得的制約が必要だと主張してきました。しかし、大規模言語モデルは比較的制約の少ない環境でも言語を学習できることを示しています。

6. 表現は最小限である必要はない

ミニマリストプログラムなど、言語の表現を極力シンプルにしようとする試みがありました。しかし、大規模言語モデルは豊かな表現を用いることでより高い性能を実現しています。

7. 階層構造は生得的である必要はない

文の階層構造は生得的だと考えられてきましたが、大規模言語モデルはデータから階層構造を学習できることを示しています。

8. 言語と思考は分離可能

チョムスキーは言語と思考が密接に結びついていると主張しましたが、大規模言語モデルは言語能力と推論能力が分離可能であることを示唆しています。

大規模言語モデルの限界

ピアンタドシ教授は、大規模言語モデルにも以下のような限界があることを認めています:

  • 人間の子供に比べて膨大な学習データを必要とする
  • 推論や思考を要するタスクでは人間に及ばない
  • モデルの内部表現の解釈が困難

しかし、これらの限界は今後の技術発展によって克服される可能性があると指摘しています。

言語学への影響と今後の展望

ピアンタドシ教授は、大規模言語モデルの成功が言語学に与える影響として以下のような点を挙げています:

  • 言語獲得における学習の重要性の再評価
  • 統語と意味の統合的な理解の必要性
  • 確率や情報理論の重要性の認識
  • 言語の普遍性や生得性に関する再考

そして、今後の言語学は以下のような方向に進むべきだと提言しています:

  • 学際的なアプローチの採用
  • 計算モデルと認知科学の統合
  • 言語の多様性と普遍性のバランスの取れた理解
  • コミュニケーションや文化進化の観点の導入

まとめ – AIは言語学を変えるか?

ピアンタドシ教授の論文は、大規模言語モデルの成功が従来の言語理論に大きな挑戦を突きつけていることを示しています。

もちろん、現在の人工知能が人間の言語能力のすべてを説明できるわけではありません。しかし、これまで「不可能」とされてきたことを可能にした大規模言語モデルの登場は、言語の本質について私たちに再考を促しています。

言語は生得的なものなのか、それとも学習可能なものなのか。文法は自律的なものか、それとも意味と密接に結びついているのか。言語と思考はどのような関係にあるのか。

これらの問いに対する答えは、今後の言語学や認知科学の発展によって明らかになっていくでしょう。大規模言語モデルの登場は、言語研究に新たな視点と方法論をもたらし、言語の本質に迫るための強力なツールとなる可能性を秘めています。

人工知能と言語学の融合は、人間の言語能力の解明と、より高度な言語処理技術の開発の両面で、大きな進展をもたらすかもしれません。言語学の常識が覆される日は、そう遠くないのかもしれません。


Piantadosi, S. T. (2023). Modern language models refute Chomsky’s approach to language. arXiv preprint.
https://lingbuzz.net/lingbuzz/007180

By 吉成 雄一郎

東海大学教授。コロンビア大学大学院ティーチャーズカレッジ(英語教授法)、信州大学大学院工学研究科(情報工学)修了。東京電機大学教授を経て現職。専門は英語教授法、英語教育システム開発。 さまざまな英語学習書、英検、TOEIC 対策書、マルチメディア教材等を手がけてきた。英語e ラーニングや英語関係の教材・コンテンツの研究開発も行う。全国の大学、短期大学、高専等で使われているe ラーニングシステム「リンガポルタ」も開発した。最近ではAI による新しい教育システムの開発にも着手している。