人工知能と人間 (岩波新書 新赤版 259)

人工知能研究の系譜

長尾氏は、まず人工知能研究の歴史を概観しています。1950年代から60年代にかけては、探索アルゴリズムの改良が中心的な課題でした。60年代から70年代にかけては、ヒューリスティックスと呼ばれる発見的手法の導入により、効率的な問題解決が目指されました。70年代から80年代には、大量の知識を組織化し、浅い推論で問題を解決する手法が主流となりました。

これらの流れを踏まえつつ、長尾氏は人工知能の本質を「記号処理」にあると位置づけています。つまり、人間の知的活動を記号表現とその操作によって実現しようとする試みです。この立場は、今日でいう「記号主義」あるいは「Good Old-Fashioned AI (GOFAI)」に相当します。

コンピュータの可能性と限界

本書の前半では、コンピュータが得意とする分野と、そこでの成果が詳述されています。

記号計算と定理の証明

コンピュータは、数式処理や定理の証明において人間を凌駕する能力を示します。長尾氏は、MITのスレーグルによる積分プログラムや、ニューエル、ショー、サイモンによる定理証明プログラムの成果を紹介しています。これらは、人間の知的活動の一部を機械化できることを示した画期的な成果でした。

しかし同時に、長尾氏はこれらの成果の限界も指摘しています。たとえば、組合せ爆発の問題があります。可能性のある手順をすべて調べ上げようとすると、計算量が爆発的に増大してしまうのです。この問題を解決するために、ヒューリスティックスの導入が不可欠となります。

ゲームと探索

チェスやチェッカーなどのゲームも、人工知能研究の重要なテーマでした。長尾氏は、ゲームにおける探索の重要性を説明し、ミニマックス法などの探索アルゴリズムを解説しています。

興味深いのは、チェスプログラムの進歩に関する長尾氏の指摘です。プログラムの評価関数を改良するよりも、より多くの手を読めるようにコンピュータを高速化する方が効果的だったということです。これは、「ブルート・フォース」と呼ばれる力まかせの探索が、洗練された探索よりも効果的であることを示唆しています。

この観察は、近年のディープラーニングの成功とも通じるものがあります。大量のデータと計算資源を投入することで、洗練されたアルゴリズムを凌駕する性能を実現できるのです。

認識への挑戦

本書の中盤では、コンピュータによるパターン認識、特に文字認識と画像認識の問題が取り上げられています。

文字認識の進歩

長尾氏は、文字認識技術の発展を詳細に解説しています。初期の文字認識システムは、テンプレートマッチングと呼ばれる手法を用いていました。これは、未知の文字パターンを、あらかじめ用意された標準パターンと比較する方法です。

しかし、この方法では文字の変形や汚れに対処できません。そこで、文字の「特徴」を抽出し、それに基づいて認識を行う手法が開発されました。長尾氏は、縦線、横線、曲線といった特徴の抽出方法や、それらの組み合わせによる認識方法を詳しく説明しています。

さらに、長尾氏は文脈情報の利用にも言及しています。たとえば、住所の認識では、地名辞書を参照することで認識精度を向上させることができます。これは、今日の機械学習システムにおける「ドメイン知識の活用」にも通じる考え方です。

画像認識と知識の重要性

画像認識の分野では、長尾氏は「黒板モデル」と呼ばれる手法を紹介しています。これは、画像の各部分に関する情報を「黒板」に書き込み、それらの情報を統合して全体の解釈を行う方法です。

黒板モデルの特徴は、トップダウン処理とボトムアップ処理を柔軟に組み合わせられる点にあります。たとえば、「道路」という高次の概念が検出されれば、それに基づいて「車」や「歩行者」の探索が行われます。逆に、「車」や「歩行者」が検出されれば、それらを含む「道路」の存在が推定されます。

この相互作用的なアプローチは、今日のディープラーニングにおける「アテンション機構」や「双方向LSTMモデル」にも通じるものがあります。高次の文脈情報と低次の特徴情報を統合することで、より robust な認識が可能になるのです。

言葉への挑戦

本書の後半では、自然言語処理の問題が詳しく論じられています。長尾氏は、言語処理を「形態素解析」「構文解析」「意味解析」の3段階に分けて説明しています。

形態素解析と構文解析

形態素解析は、文を単語に分割する処理です。日本語のような膠着語では、この処理が特に重要となります。長尾氏は、辞書と文法規則を用いた形態素解析の方法を解説しています。

構文解析では、文の構造を明らかにします。長尾氏は、チョムスキーの句構造文法や、フィルモアの格文法といった言語学の知見を紹介しながら、コンピュータによる構文解析の方法を説明しています。

特に興味深いのは、長文の解析に関する長尾氏の洞察です。長尾氏は、文が長くなるほど構文的曖昧性が増大し、解析が困難になることを指摘しています。この問題に対処するため、長尾氏は「類似性の検出」という方法を提案しています。これは、文中の類似した構造を見つけ出し、それを手がかりに全体の構造を推定する方法です。

この考え方は、今日の自然言語処理における「自己注意機構 (self-attention)」にも通じるものがあります。自己注意機構は、文中の各要素間の関連性を計算し、それに基づいて全体の意味を捉える仕組みです。長尾氏の洞察は、現代の最先端技術を先取りしていたと言えるでしょう。

意味解析と知識の問題

意味解析の段階では、文の意味を理解し、適切な行動を取ることが求められます。長尾氏は、この段階で「知識」の重要性が増すことを強調しています。

たとえば、「象は鼻が長い」という文を英語に翻訳する場合を考えてみましょう。単純に語順を変えただけでは、”An elephant is long its nose.” のような不自然な文になってしまいます。適切に “An elephant has a long trunk.” と訳すためには、「象の体の一部である鼻」という知識が必要になります。

長尾氏は、このような知識をコンピュータに与えることの難しさを指摘しています。人間が持つ常識的知識は膨大で、しかも曖昧で矛盾を含んでいます。これをすべて明示的にコンピュータに与えることは、事実上不可能です。

この問題に対する長尾氏の提案は、「例文による翻訳」という方法です。これは、大量の対訳例文を用意し、入力文と類似した例文を見つけ出して翻訳を行う方法です。この考え方は、今日の統計的機械翻訳や、ニューラル機械翻訳にも通じるものがあります。

理解することへの挑戦

本書の終盤では、「考える」「わかる」といった、より高次の知的活動について論じられています。

考えるということ

長尾氏は、「考える」という行為を、知識を用いた推論として捉えています。その典型は、「AならばB」という形の推論です。しかし、長尾氏はこのような単純な推論だけでは人間の思考を説明できないことを指摘しています。

人間の思考の特徴として、長尾氏は以下の点を挙げています:

  1. 場を重視する:局所的な推論だけでなく、全体の状況を考慮に入れる。
  2. 定石を用いる:過去の経験から得られた典型的なパターンを活用する。
  3. 浅い推論を多用する:深い推論よりも、多くの知識を用いた浅い推論を行う。

これらの特徴は、今日の機械学習システムにも反映されています。たとえば、「場を重視する」という考え方は、畳み込みニューラルネットワークにおける「受容野」の概念に通じます。「定石を用いる」という考え方は、転移学習や事前学習モデルの活用に反映されています。「浅い推論を多用する」という考え方は、ディープラーニングにおける「スキップ接続」の概念にも通じるものがあります。

わかるということ

「わかる」ということの本質について、長尾氏は興味深い考察を展開しています。長尾氏によれば、「わかる」とは単に正解を得ることではありません。むしろ、その答がどのようにして導出されたかを知ること、そしてその過程を相手に説明できることが重要だということです。

この観点は、今日の「説明可能なAI (XAI: eXplainable AI)」の研究にも通じるものがあります。AIシステムの判断根拠を人間が理解できる形で示すことは、AIの社会実装において極めて重要な課題となっています。

さらに長尾氏は、「わかる」ということの相対性も指摘しています。人によって知識や経験が異なるため、同じ説明を聞いても理解の程度は異なります。この問題に対処するには、相手の知識レベルを推定し、それに応じた説明を行う必要があります。

この考え方は、今日の「パーソナライズドAI」の概念にも通じます。ユーザーの特性や好みに応じて、AIシステムの振る舞いを調整する技術が、様々な分野で研究・開発されています。

人工知能と哲学

本書の最終章では、人工知能研究が提起する哲学的問題が論じられています。

記号処理の限界

長尾氏は、記号処理に基づく従来の人工知能アプローチの限界を指摘しています。人間の知能は、言語化できない暗黙知や身体性と密接に結びついています。これらを単純な記号操作で表現することには限界があります。

この洞察は、今日の「身体化認知 (Embodied Cognition)」の考え方にも通じるものです。知能は単に頭の中にあるのではなく、環境との相互作用の中で成立するという考え方が、認知科学や人工知能研究に大きな影響を与えています。

創造性の問題

長尾氏は、創造性の本質について深い考察を展開しています。創造性は単に新しいものを作り出すことではなく、それが価値あるものとして認められることが重要だと長尾氏は指摘しています。

この観点は、今日の「計算創造性 (Computational Creativity)」の研究にも反映されています。AIが生成した作品が「創造的」と評価されるためには、新規性だけでなく、文化的・社会的な文脈の中での価値も考慮する必要があります。

相対主義と価値の問題

本書の結論部分で、長尾氏は知識や真理の相対性を強調しています。絶対的な真理は存在せず、すべては近似と相対の世界だということです。

しかし同時に、長尾氏は単なる相対主義に陥ることの危険性も指摘しています。代わりに、より広い文脈、より長い時間スケールで物事を捉え、そこでの「価値」を追求することの重要性を説いています。

この考え方は、今日の「AI倫理」の議論にも通じるものがあります。AIシステムの設計や運用に際して、短期的な効率や利益だけでなく長期的な社会的影響や人類全体の福祉を考慮することの重要性が、広く認識されるようになっています。

評価と展望

『人工知能と人間』は、人工知能研究の本質的な課題と可能性を、広い視野から論じた秀逸な書です。特に以下の点で、本書の価値は高いものと思われます。

  1. 技術と哲学の融合: 長尾氏は、人工知能の技術的側面だけでなく、それが提起する哲学的問題にも深く切り込んでいます。知能とは何か、理解とは何か、創造性とは何かといった根源的な問いに、技術者の視点から迫っている点が興味深いです。
  2. 広範な知識の統合: 本書は、計算機科学、認知科学、言語学、哲学など、多岐にわたる分野の知見を統合しています。これにより、人工知能の問題を多角的に捉えることに成功しています。
  3. 先見性: 本書が書かれた1992年当時、人工知能研究は冬の時代を迎えていました。しかし長尾氏は、人工知能の可能性を冷静に見極め、その後の発展を的確に予見しています。たとえば、大規模データの重要性や、ニューラルネットワークの再評価といった点は、今日の人工知能ブームを先取りしていたと言えます。
  4. 謙虚さと慎重さ: 長尾氏は、人工知能の可能性を高く評価しつつも、その限界にも目を向けています。特に、人間の知能の複雑さや、言語化できない知識の重要性を強調している点が注目されます。これは、しばしば過度に楽観的になりがちな人工知能研究に対する、重要な警鐘と言えるでしょう。
  5. 実践的な視点: 長尾氏自身が多くの人工知能システムの開発に携わってきた経験が、本書の随所に反映されています。理論と実践のバランスが取れた記述は、本書の大きな魅力の一つです。

もちろん、本書にも限界はあります。1992年の出版であるため、深層学習やビッグデータといった、今日の人工知能研究の中心的トピックについては触れられていません。また、インターネットの普及や、モバイルデバイスの発達といった、今日の情報環境の変化も予見されていません。

しかし、これらの限界を差し引いても、本書の価値は決して減じません。むしろ、人工知能研究の本質的な課題が、30年以上の時を経てもなお変わっていないことに驚かされます。記号とパターン、論理と直感、知識と経験、そして人間と機械の関係。これらの問題は、今日の人工知能研究においても中心的な課題であり続けています。

さらに、長尾氏の提起した「より広い文脈での価値の追求」という視点は、今日ますます重要性を増しています。AIの社会実装が進み、その影響力が増大する中で、短期的な効率や利益だけでなく、長期的な社会的影響を考慮することの重要性が認識されつつあります。

本書は、人工知能研究の過去と現在を結ぶ重要な架け橋であり、同時に、これからの方向性を示す指針でもあります。人工知能研究者はもちろん、技術の社会的影響に関心を持つ一般読者にとっても、示唆に富む一冊と言えるでしょう。

人工知能技術が急速に発展し、社会に大きな影響を与えつつある今日、改めて本書を読み返すことには大きな意義があります。技術の可能性と限界を冷静に見極め、人間と機械の適切な関係を模索する上で、本書は貴重な指針を与えてくれるはずです。

 

By 吉成 雄一郎

東海大学教授。コロンビア大学大学院ティーチャーズカレッジ(英語教授法)、信州大学大学院工学研究科(情報工学)修了。東京電機大学教授を経て現職。専門は英語教授法、英語教育システム開発。 さまざまな英語学習書、英検、TOEIC 対策書、マルチメディア教材等を手がけてきた。英語e ラーニングや英語関係の教材・コンテンツの研究開発も行う。全国の大学、短期大学、高専等で使われているe ラーニングシステム「リンガポルタ」も開発した。最近ではAI による新しい教育システムの開発にも着手している。