はじめに:著者と研究背景

本論文”Linguistic data model for natural languages and artificial intelligence. Part 1. Categorization”の著者であるオレグ・ポリャコフ氏は、サンクトペテルブルク国立航空機器大学の准教授として、情報技術起業学部に所属しています。技術科学の候補者学位(1982年取得)を持つ同氏は、言語学、人工知能、数学、データベース設計理論、哲学という幅広い分野にわたって30以上の学術論文を発表してきました。この学際的な背景が、本論文で提案される「R言語学(関係の言語学)」という新たなアプローチの基盤となっています。

論文が掲載された『DISCOURSE』誌は2019年の第5巻第4号で、査読を経て公開されています。著者は本論文を皮切りに、R言語学に関する一連の論文を発表する予定であることを明記しており、この論文は分野の基礎となる分類化理論を扱った第一部に位置づけられています。

R言語学の基本的発想とその問題点

ポリャコフ氏が提案するR言語学は、人間の精神的・言語的活動が「意識による世界モデルの使用」に基づいているという仮説から出発します。この世界モデルは、「世界で観察される関係や、コミュニケーション過程で意識が受け取る関係を特別に処理したシステム」として定義されています。

著者はさらに、意識の主要機能が「事象、行動、現象などの予測」であると主張し、この予測機能が種の生存を可能にする重要な要素だと論じています。確かに、私たちは日常的に筋肉の収縮を予測して物に触れたり、信号の色の変化を予測したりしており、この指摘には一定の説得力があります。

しかし、この理論的基盤には重要な問題があります。まず、意識の主要機能が予測であるという主張に対する実証的根拠が提示されていません。認知科学や神経科学における意識研究の膨大な蓄積を参照することなく、この中核的仮説を単なる前提として扱っています。意識の機能については、予測以外にも注意の統制、情報の統合、自己認識など、様々な側面が研究されており、予測機能のみを特権化する理由が不明確です。

また、関係の観察に基づく世界のモデリングが言語活動の本質を捉えているかという点についても疑問が残ります。言語は確かに関係を表現しますが、音韻、形態、統語、意味、語用といった多層的な構造を持つ複雑なシステムです。関係論的アプローチだけで言語の全体を説明できるかは自明ではありません。

数学的形式化の試み:公理系の導入

本論文の中核は、分類化過程の公理化にあります。ポリャコフ氏は、対象の集合Uに対して分類を形成する操作θを定義し、以下の二つの公理を提案します:

公理A1(拡張性):X ⊆ θ(X) – 分類の基となった例はその分類に含まれる 公理A2(正当性):X ⊆ Cから θ(X) ⊆ Cが導かれる – 分類内の例から新たな分類を作ってもその分類を超えない

これらの公理は数学的には一貫性を持っており、著者は既知の閉包演算の公理系との等価性を証明しています。さらに、ムーアの公理系との関連も示し、分類の族が完全格子を形成することを明らかにしています。

この数学的な厳密さは評価できる点です。分類化という概念的には曖昧になりがちな過程を、明確な公理によって定義しようとする試みは理論構築の観点から重要です。また、異なる公理系との等価性を示すことで、提案する枠組みの数学的な妥当性を検証している点も評価できます。

しかし、この形式化には根本的な限界があります。まず、なぜこれらの公理が分類化の本質を捉えていると言えるのかという正当化が不十分です。言語学や認知科学における分類研究の蓄積と照らし合わせた検討がなされていません。プロトタイプ理論、基本レベル分類、文化的変異など、分類に関する豊富な実証研究との関連が明示されていないため、提案する公理が実際の分類現象をどの程度説明できるのか判断できません。

言語的空間と生成子の概念

論文では「言語的空間」という概念が導入されます。これは分類の族が形成する数学的構造で、位相空間の一般化として位置づけられています。著者は位相空間との類似性を指摘しながらも、言語的空間が有限の対象領域でも意味を持つ点で異なると主張しています。

さらに、言語的空間の「生成子」という概念が定義されます。∩生成子は他の分類の交わりとして表現できない分類、∪生成子は他の分類の結合として表現できない非空の分類、Σ生成子は他の分類の加算として表現できない非空の分類です。これらの生成子と「型」(同じ分類に属する要素の最大集合)との関係も詳細に分析されています。

この部分の数学的展開は技術的に精緻ですが、言語学的な意義が不明確です。言語的空間や生成子という概念が、実際の言語現象の理解にどのように貢献するのかが示されていません。抽象的な数学的構造として興味深くても、言語の具体的な問題に適用できなければ、言語学的理論としての価値は限定的です。

三つの分類化方法とその評価

論文の後半では、三つの分類化方法が提示されます:一般から特殊への分類化、特殊から一般への分類化、そして動詞的分類化です。

特殊から一般への分類化では、「X ⇢ z」という産出関係(「zはXに含まれる対象の特殊例である」)を用いて分類を構築します。著者は具体例として、5つの要素を持つ集合と6つの産出関係を示し、この方法による分類形成過程を説明しています。

動詞的分類化は最も重要とされる方法で、二項関係(動詞)に基づいて分類を形成します。これはガロア対応の発展として位置づけられ、空間と余空間の間の双対的関係を通じて分類構造を構築します。著者は、この方法が対象の行動予測を可能にするため、他の方法よりも重要だと主張しています。

動詞的分類化のアイデアは確かに言語学的に興味深いものです。動詞が表す関係に基づいて名詞の分類を行うという発想は、語彙意味論や認知言語学の知見と接続可能性を持っています。しかし、ここでも具体的な言語データによる検証が不足しています。実際の動詞がどのような分類構造を生み出すのか、異なる言語間でこの構造がどう変化するのかといった実証的検討が必要です。

認知言語学との関係と限界

論文では認知言語学の分類研究に言及し、公理化によって認知言語学の根本的問題を明らかにできると述べています。また、ウィトゲンシュタインの「ゲーム」カテゴリーの例を挙げ、特徴による定義ではなく動作(「遊ぶ」)によって決まるカテゴリーの存在を指摘しています。

この指摘は重要な問題を提起しています。確かに、すべてのカテゴリーが必要十分条件によって定義できるわけではなく、家族的類似性や典型性効果など、より複雑な原理が働いています。動詞的分類化という提案は、こうした問題に対する一つの解答として位置づけることができるかもしれません。

しかし、著者の議論には重要な見落としがあります。認知言語学では既に、プロトタイプ理論、メタファー理論、フレーム理論など、特徴による古典的分類を超えた理論が発展しています。これらの既存理論と提案する枠組みの関係が明確にされていないため、R言語学の独自性や優位性を評価することができません。

ファジー分類への言及と問題

論文の終盤で、著者はファジー分類について興味深い議論を展開しています。「捕食者」カテゴリーには明確な識別特徴がないため境界が曖昧だとする一般的な見方に対し、著者は分類化の公理A1とA2にはファジー性への言及がないと指摘します。「ファジーに他の生物を攻撃してその肉をファジーに飲み込むことはできない」という表現で、行動レベルでは明確な境界があることを強調しています。

この指摘は鋭いものです。分類の境界が曖昧に見えるのは、識別特徴の問題であって、分類形成の根本的原理の問題ではないという視点は考慮に値します。しかし、この議論も表面的な段階にとどまっており、ファジー論理や可能性理論との詳細な比較検討が必要です。

実証的検証の欠如

本論文の最大の問題は、実証的検証の欠如です。数学的に厳密な理論が構築されていますが、それが実際の言語現象をどの程度説明できるのかが示されていません。言語学理論の価値は、言語の多様性や複雑性をどれだけ統一的に説明できるかで決まります。

具体的には、以下のような検証が必要です:

まず、異なる言語における分類システムの比較分析です。提案する公理や分類方法が言語普遍的な原理を捉えているなら、言語間での一致点と相違点を説明できるはずです。また、言語習得過程における分類の発達を追跡することで、理論の心理的妥当性を検証できます。

さらに、計算言語学的応用も重要です。R言語学が人工知能への応用を目的とするなら、実際のNLPタスクでの性能評価が不可欠です。自然言語理解、知識表現、推論システムなどでの有効性を示す必要があります。

既存研究との関連性の不明確さ

論文では数学的な参考文献(ムーア、ビルクホフ、クラトフスキーなど)は適切に引用されていますが、言語学的研究との関連が不十分です。分類研究の先駆的業績であるロッシュの基本レベル分類理論、レイコフの女性・火・危険なものの研究、クロフトとクルーズの認知言語学的分類論などとの比較検討がありません。

また、形式意味論における種類理論(type theory)や状況意味論(situation semantics)といった、関係に基づく意味理論との関連も明示されていません。これらの既存理論との差異や優位性を明確にしなければ、R言語学の位置づけが曖昧になってしまいます。

用語と概念の問題

論文で使用される用語にも問題があります。「言語的空間」「動詞」「共動詞」といった専門用語が独自に定義されていますが、既存の言語学用語との関係が不明確です。特に「動詞」という用語は、一般的な言語学では品詞カテゴリーを指しますが、ここでは数学的写像を意味しており、混乱を招く可能性があります。

また、「R言語学」という名称自体も問題です。「R」が関係(relation)を意味することは理解できますが、プログラミング言語のRとの混同を避けるためにも、より適切な命名が望ましいでしょう。

哲学的基盤の問題

著者は哲学的基盤についての議論は別の機会に譲ると述べていますが、これは理論の根本的な妥当性を評価する上で重要な欠陥です。言語と現実の関係、意味と指示の問題、主観性と客観性の関係など、言語学理論には避けて通れない哲学的問題があります。

特に、意識による世界モデルという中核的概念について、現象学的伝統、分析哲学、心の哲学などとの関連を明確にする必要があります。フッサールの志向性理論、ウィトゲンシュタインの言語ゲーム論、サールの心の哲学などとの比較検討なしには、理論の哲学的位置づけが曖昧になってしまいます。

応用可能性の限界

論文では人工知能への応用が目的として掲げられていますが、具体的な応用例が示されていません。現代のAI研究では、深層学習による分散表現、トランスフォーマーモデル、大規模言語モデルなどが主流となっています。これらのアプローチと比較して、R言語学がどのような優位性を持つのかが不明です。

また、自然言語処理の具体的タスクへの適用可能性も疑問です。機械翻訳、質問応答、文書分類、感情分析などの実用的なタスクで、提案する理論がどのような貢献をできるのかが示されていません。

方法論的問題

本論文の方法論には根本的な問題があります。数学的形式化から出発して言語現象を説明しようとするトップダウン的アプローチは、言語の実証的特性を軽視する危険性があります。言語学では、豊富な言語データの観察と分析から理論を構築するボトムアップ的アプローチが重要視されており、この点でのバランスが取れていません。

また、理論の経験的検証可能性についても問題があります。ポパーの反証可能性の原理に従えば、科学的理論は原理的に反証可能でなければなりません。しかし、提案される公理系がどのような条件下で反証されうるのかが明確ではありません。

今後の研究への提言

これらの問題点を踏まえ、R言語学の発展のためには以下のような改善が必要です:

まず、実証的検証の充実です。多様な言語における分類システムの詳細な分析、言語習得や言語変化における分類の発達過程の追跡、計算言語学的タスクでの性能評価などが必要です。

次に、既存理論との関連の明確化です。認知言語学、形式意味論、心理言語学などの既存研究との比較検討を通じて、R言語学の独自性と限界を明確にする必要があります。

さらに、哲学的基盤の整備です。意識、意味、分類に関する哲学的議論を踏まえた理論的基盤の構築が不可欠です。

最後に、用語体系の整理です。既存の言語学用語との関係を明確にし、混乱を避けるための適切な命名が必要です。

結論:理論的野心と実証的課題

ポリャコフ氏の論文は、言語現象の数学的形式化という野心的な試みを提示しています。分類化過程の公理化、言語的空間の概念、動詞的分類化の提案など、技術的には興味深いアイデアが含まれています。また、意識の予測機能に基づく言語理論という発想は、従来の言語学とは異なる視点を提供しています。

しかし、理論の実証的基盤の弱さ、既存研究との関連の不明確さ、具体的応用例の欠如など、重要な問題も多く存在します。数学的厳密性は評価できますが、それが言語の本質的特性を捉えているかは別問題です。

言語学は本質的に経験科学であり、理論は豊富な言語データによって検証されなければなりません。R言語学が真に価値ある理論となるためには、数学的美しさと実証的妥当性のバランスを取ることが必要です。著者が予告している続編の論文では、これらの課題への取り組みが期待されます。

特に重要なのは、提案する理論が既存の言語学理論では説明困難な現象をどの程度説明できるかという点です。言語の創造性、文脈依存性、社会的変異性、個人差などの複雑な現象に対して、R言語学がどのような説明を提供できるかが今後の鍵となるでしょう。

本論文は、言語学への数学的アプローチの可能性と限界を考える上で有益な出発点を提供しています。しかし、真に科学的な言語理論として確立されるためには、より広範囲で詳細な実証的検証が不可欠です。この点で、今後の研究の発展が注目されます。


Polyakov, O. M. (2019). Linguistic data model for natural languages and artificial intelligence. Part 1. Categorization. DISCOURSE, 5(4), 102–114. https://doi.org/10.32603/2412-8562-2019-5-4-102-114

By 吉成 雄一郎

株式会社リンガポルタ代表取締役社長。東京電機大学教授、東海大学教授を経て現職。コロンビア大学大学院ティーチャーズカレッジ(英語教授法)、信州大学大学院工学研究科(情報工学)修了。専門は英語教授法、英語教育システム開発。 さまざまな英語学習書、英検、TOEIC 対策書、マルチメディア教材等を手がけてきた。英語e ラーニングや英語関係の教材・コンテンツの研究開発も行う。全国の大学、短期大学、高専等で使われているe ラーニングシステム「リンガポルタ」も開発した。最近ではAI による新しい教育システムの開発にも着手している。

Amazon プライム対象