はじめに:AIと心理学の意外な関係

現代社会において、人工知能(AI)は私たちの生活に深く根ざしています。スマートフォンの音声認識から自動運転車、医療診断まで、AIは様々な分野で人間の能力を上回る成果を示しています。しかし、こうしたAIの成功は、果たして人間の思考プロセスを参考にして達成されたものなのでしょうか。

ドイツのマックス・プランク人間開発研究所のGerd Gigerenzer氏が2024年に発表した論文”Psychological AI: Designing Algorithms Informed by Human Psychology”は、この疑問に正面から取り組んでいます。Gigerenzer氏は長年にわたって人間の意思決定プロセス、特に不確実な状況下での判断メカニズムを研究してきた心理学者です。彼の研究は、人間が完全に論理的でなくても、多くの場合において合理的で効果的な判断を下せることを示してきました。

この論文では、AIアルゴリズムの設計において心理学的知見を活用する「心理学的AI」という新しいアプローチを提案しています。一見すると、高速で正確な計算能力を持つコンピューターに、不完全で偏見を持ちがちな人間の思考を取り入れることは矛盾しているように思えます。しかし、Gigerenzer氏は具体的な事例を通じて、この一見逆説的なアプローチが実際に有効であることを示そうとしています。

従来のAI成功事例が示す興味深いパターン

論文の冒頭で、Gigerenzer氏は興味深い観察を提示しています。AIの歴史的な成功事例を振り返ると、そのほとんどが心理学的知見をほとんど活用していないという事実です。

1997年にチェスの世界王者ガルリ・カスパロフを破ったIBMのDeep Blueは、チェスマスターの思考プロセスに関する心理学的研究を基にしていませんでした。開発者の一人であるJoe Hoane氏は、「これは人工知能プロジェクトではない。純粋に計算速度でチェスをプレイし、可能性を検討して一つの手を選ぶプロジェクトだ」と明言しています。

同様に、かつて大きな注目を集めたGoogleの「Google Flu Trends」も、5000万の検索用語と4億5000万の異なるアルゴリズムを分析した純粋なビッグデータ解析でした。自然言語処理で話題のGPT-4も、大量のオンラインテキストから数十億のパラメータを推定する統計的手法に基づいており、言語の意味論や語用論といった心理学的知見はほとんど反映されていません。

これらの事例から、Gigerenzer氏は重要な疑問を提起します。「もし人間の思考が数百万年の進化によって洗練されたものなら、なぜエンジニアたちはそれを参考にしないのか?」この疑問は、現在のAI開発における根本的な方向性について再考を促すものです。

安定世界原理:AIの得意分野と苦手分野を区別する

Gigerenzer氏の論文の核心的な貢献の一つは、「安定世界原理」という概念の提示です。これは、AIがどのような問題で優れた性能を発揮し、どのような問題で苦戦するのかを理解するための重要な枠組みです。

この原理によると、複雑なアルゴリズムとビッグデータは、明確に定義された安定した状況において最も効果的に機能します。チェス、囲碁、クイズ番組「Jeopardy!」などのゲームがその典型例です。これらの分野では、ルールが明確で変化せず、可能な状態と結果がすべて既知です。経済学者のナイト(1921年)が定義した「リスク状況」、つまり確率分布が既知または推定可能な状況に相当します。

一方、人間の知能は不確実性、つまりナイトの言う「不確実性状況」に対処するために進化してきました。これは、将来の状態や結果が完全には予測できない、ルールが変化する可能性がある、予期しない出来事が起こりうる状況です。

この区別は、なぜAIが特定の分野で人間を上回る一方で、他の分野では苦戦するのかを説明します。例えば、AIはチェスの世界王者を破ることができても、人間が作成したcaptcha(コンピューターと人間を区別するテスト)に苦戦することがあります。ビッグデータは天文学の予測には有効でも、2008年の金融危機やトランプ大統領の勝利を予測することはできませんでした。

最近性ヒューリスティクス:一つのデータポイントがビッグデータに勝つ事例

論文の最も説得力のある事例の一つは、最近性(recency)ヒューリスティクスの応用です。最近性とは、最近の出来事により重要性を与える人間の傾向のことです。心理学では、より最近に遭遇した出来事がより良く記憶される「最近性効果」として知られています。

従来の統計学的思考では、最近性は「利用可能性バイアス」として批判されることがあります。長期的な基準率(過去のデータ)に基づいて判断すべきで、最近の出来事に惑わされるべきではないという考え方です。しかし、Gigerenzer氏は、この見解が安定した世界を前提としていることを指摘します。

環境が変化する可能性がある不安定な世界では、最近の情報に重きを置くことが合理的な判断につながる場合があります。論文では興味深い思考実験が紹介されています。車の購入と子どもの遊び場所の選択という二つのシナリオを比較することで、同じ論理構造でも文脈によって最適な判断が変わることを示しています。

この理論的考察を踏まえ、研究チームはインフルエンザの流行予測に最近性ヒューリスティクスを適用しました。Google Flu Trendsが5000万の検索クエリと複雑なアルゴリズムを使用していたのに対し、彼らが提案した最近性ヒューリスティクスは驚くほど単純です。

「今週のインフルエンザ関連の医師受診率は、最も最近の週の受診率と等しい」

この単純なアルゴリズムを2007年3月18日から2015年8月9日までの期間でテストした結果、平均予測誤差は9%でした。一方、Google Flu Trendsの誤差は20%でした。さらに注目すべきことに、この優位性はGoogle Flu Trendsの3回のアップデートすべてに対して、また2007年から2015年のすべての年において維持されました。

2009年の豚インフルエンザ(H1N1)の流行時には、この違いがより顕著になりました。Google Flu Trendsは通常のインフルエンザパターン(冬に高く夏に低い)を学習していたため、異なるパターンを示した豚インフルエンザの流行を数か月にわたって過小予測しました。一方、最近性ヒューリスティクスは新しいパターンに迅速に適応できました。

数値の丸め:精度を犠牲にして理解を向上させる逆説

もう一つの興味深い事例は、数値の「丸め」(rounding)に関する研究です。一般的に、正確な数値は丸められた数値よりも優れていると考えられがちです。しかし、心理学研究は異なる現実を示しています。

人間は、デジタル時計で正確な時刻を見ることができても、時間について尋ねられると5分や15分刻みの丸められた数値で答える傾向があります。これは単なる怠慢ではありません。精度を下げることで、時間単位の記憶と暗算処理が速くなるという利点があります。

Nguyen氏らの研究では、参加者に正確な数値または丸められた数値を含むニュース記事を読ませました。興味深いことに、丸められた数値を読んだ参加者の方が、元の正確な数値により近い値を想起できました。また、割合の計算においても、丸められた数値を読んだ参加者の方が優れた成績を示し、反応時間も速くなりました。

この心理学的知見を基に、Jung氏らは「選択-回帰-丸め」手法を開発しました。これは、機械学習による特徴選択と心理学的知見を組み合わせたハイブリッドモデルです。

手法は以下の3段階から構成されます。まず、すべての特徴から段階的にk個の特徴を選択します。次に、これらの特徴のみを使用してL1正則化(lasso)ロジスティック回帰モデルを訓練します。最後に、得られた重みを整数範囲[-M, M]にスケーリングし、最も近い整数に丸めます。

この手法を165,000件の成人刑事法廷事例に適用した結果、驚くべき結果が得られました。64の特徴すべてを使用する複雑な機械学習モデルと同等の性能を、わずか2つの特徴(年齢と過去の出廷拒否回数)と整数の重みのみで実現できました。

最終的なアルゴリズムは極めて単純で理解しやすいものです。18歳以上21歳未満なら3点、21歳以上31歳未満なら2点、31歳以上51歳未満なら1点を年齢に基づいて加算し、過去の出廷拒否が1回なら2点、2回以上なら3点を加算します。合計が3.5点以上なら保釈を拒否し、それ以下なら保釈を認めるという判断基準です。

説明可能AIへの新たなアプローチ

現在のAI分野における重要な課題の一つは、「説明可能AI」(Explainable AI, XAI)の実現です。多くの高性能な機械学習モデル、特に深層学習モデルは「ブラックボックス」として機能し、その意思決定プロセスを人間が理解することは困難です。

この問題に対する従来のアプローチは、ブラックボックスモデルを保持しつつ、別のモデルや可視化手法(ヒートマップ、サリエンシーマップなど)によって事後的に説明を試みるものでした。しかし、これらの説明がAIが実際に行っていることを正確に反映しているかどうかは疑問視されています。

Gigerenzer氏は、この問題に対して根本的に異なるアプローチを提案しています。ブラックボックスを説明しようとするのではなく、最初から理解可能で透明なアルゴリズムを設計するという考え方です。心理学的AIは、この目標を達成するための有効な手段となります。

論文では、「精度-解釈可能性トレードオフ」という一般的な信念に疑問を呈しています。この信念によると、アルゴリズムが正確であればあるほど、解釈しにくくなるとされています。しかし、インフルエンザ予測と再犯予測の事例は、このトレードオフが常に成り立つわけではないことを示しています。

実際、Green氏とArmstrong氏による97の研究のレビューでは、複雑さが予測誤差を平均27%増加させることが報告されています。つまり、多くの場合において、単純なモデルの方が複雑なモデルよりも優れた予測性能を示すのです。

研究手法と実証的根拠の検討

この論文の強みの一つは、理論的な議論だけでなく、具体的な実証的証拠を提供していることです。インフルエンザ予測の事例では、2007年から2015年という長期間にわたるデータを使用し、Google Flu Trendsとの直接的な比較を行っています。また、複数の誤差測定方法を用いることで、結果の頑健性を確認しています。

再犯予測の事例でも、165,000件という大規模なデータセットを使用し、UCI機械学習リポジトリの21のデータセットでの追加検証も行っています。これらの規模と範囲は、研究結果の一般化可能性を支持する要因となっています。

しかし、批判的な視点から見ると、いくつかの限界も指摘できます。まず、事例の数が限定的であることです。論文では主に2つの具体的な応用例(インフルエンザ予測と再犯予測)が詳細に検討されていますが、心理学的AIの一般的な有効性を主張するには、より多様な分野での検証が必要かもしれません。

また、選択バイアスの可能性も考慮する必要があります。著者が心理学的アプローチが有効であることを既に信じている場合、無意識のうちにそれを支持する事例を選択している可能性があります。より客観的な評価のためには、心理学的アプローチが失敗した事例についても同程度の詳細な分析が求められるでしょう。

統計学習理論との関係性

論文で提示されたアイデアは、統計学習理論の観点からも興味深い示唆を提供しています。特に、バイアス-バリアンストレードオフという機械学習の基本原理との関連が注目されます。

複雑なモデルは訓練データに対しては高い精度を示しますが、新しいデータに対しては過学習によって性能が劣化する可能性があります(高バリアンス)。一方、単純なモデルは訓練データに対しては劣るかもしれませんが、新しいデータに対しては安定した性能を示す可能性があります(低バリアンス、しかし潜在的に高バイアス)。

心理学的AIのアプローチは、本質的にこのトレードオフにおいてバイアス側に重きを置いています。最近性ヒューリスティクスは過去のすべての情報を無視するという意味で明らかにバイアスを持ちますが、変化する環境において低いバリアンスを実現します。

この観点は、心理学的AIがなぜ特定の状況で有効なのかを理論的に理解する助けとなります。不確実性の高い環境では、完璧な統計モデルを構築することが困難であり、むしろ頑健で単純な戦略の方が優れた結果をもたらす可能性があります。

認知科学と計算科学の接点

この研究は、認知科学と計算科学の興味深い接点を示しています。伝統的に、これらの分野は異なる目標を持って発展してきました。認知科学は人間の思考プロセスを理解することを目指し、計算科学は効率的で正確なアルゴリズムの開発を目指してきました。

しかし、Gigerenzer氏の研究は、これらの分野が相互に利益を得られることを示唆しています。人間の認知プロセスを理解することが、より良いアルゴリズムの開発につながり、逆にアルゴリズムの性能分析が、人間の認知の合理性について新しい理解をもたらす可能性があります。

例えば、最近性ヒューリスティクスの成功は、人間がなぜこのような認知傾向を持つのかについて進化的な説明を提供します。変化する環境において生存するために、人間は最新の情報により重きを置く能力を発達させた可能性があります。

実用化への課題と制約

論文の提案は理論的に興味深く、限定的な事例では有効性を示していますが、実用化に向けてはいくつかの課題があります。

まず、心理学的AIが有効な領域の境界を正確に特定することが重要です。安定世界原理は有用な指針を提供しますが、実際の問題においてその境界は必ずしも明確ではありません。多くの現実問題は、安定した要素と不安定な要素を併せ持っています。

また、心理学的ヒューリスティクスの選択と調整の問題もあります。人間は状況に応じて異なるヒューリスティクスを使い分けますが、この選択プロセス自体が高度な認知能力を要求します。アルゴリズムにおいて、いつどのヒューリスティクスを使用すべきかを決定する方法は、さらなる研究が必要な領域です。

さらに、組織や社会レベルでの受容性も考慮する必要があります。単純なアルゴリズムは理解しやすい一方で、「洗練されていない」という印象を与える可能性があります。特に、高度な技術への期待が高い分野では、単純さが品質の低さと誤解される危険性があります。

倫理的考慮事項

心理学的AIのアプローチは、AI倫理の観点からも重要な意味を持ちます。透明で理解可能なアルゴリズムは、説明責任と公正性の向上に寄与する可能性があります。

再犯予測の事例では、年齢と過去の出廷拒否回数という明確で検証可能な要因のみを使用しています。これは、人種、性別、社会経済的地位などの潜在的に偏見を含む要因を排除する効果があります。また、判断プロセスが完全に透明であるため、不当な扱いを受けたと感じる個人は、その根拠を理解し、必要に応じて異議申し立てを行うことができます。

ただし、単純さが必ずしも公正性を保証するわけではないことにも注意が必要です。年齢という要因は、ある意味で差別的な側面を持つ可能性があります。また、過去の行動に基づく予測は、社会復帰を目指す個人にとって不利になる可能性もあります。

他の研究との比較と位置づけ

この研究を機械学習の他のアプローチと比較すると、いくつかの類似点と相違点が浮かび上がります。

正則化手法(リッジ回帰、lasso回帰)も、モデルの複雑さを制限することで汎化性能を向上させることを目指しています。心理学的AIのアプローチは、この考え方を極端に推し進めたものと見ることができます。ただし、正則化は統計学的な原理に基づいているのに対し、心理学的AIは人間の認知プロセスに基づいている点が異なります。

アンサンブル学習の分野では、単純な学習器を組み合わせて性能を向上させる手法が研究されています。心理学的AIは、個々の単純なヒューリスティクスの有効性に焦点を当てており、組み合わせよりも個別の性能を重視している点が特徴的です。

転移学習の分野では、一つのドメインで学習した知識を別のドメインに適用する手法が研究されています。心理学的AIのアプローチは、人間という「ドメイン」で有効なヒューリスティクスを機械学習に転移することと解釈できるかもしれません。

今後の研究方向性

この論文が開拓した心理学的AI分野には、多くの探索すべき方向性があります。

まず、より多様な認知ヒューリスティクスのアルゴリズムへの応用が考えられます。論文では最近性と丸めに焦点を当てていますが、認知科学では他にも多くのヒューリスティクスが知られています。例えば、利用可能性ヒューリスティクス、代表性ヒューリスティクス、固着効果なども、適切な文脈では有効なアルゴリズム設計の原理となる可能性があります。

また、複数のヒューリスティクスを組み合わせるメタヒューリスティクスの研究も重要です。人間は状況に応じて異なる認知戦略を使い分けます。この適応的な選択プロセスをアルゴリズムで再現することができれば、より柔軟で効果的なシステムを構築できるでしょう。

さらに、心理学的AIの有効性を予測する理論的枠組みの発展も必要です。安定世界原理は良い出発点ですが、より精密で予測的な理論を構築することで、新しい問題領域への応用可能性を事前に評価できるようになるでしょう。

実践的応用の可能性

この研究の成果は、多くの実践的な応用可能性を秘めています。

医療分野では、診断支援システムにおいて複雑な機械学習モデルの代替として心理学的AIが活用される可能性があります。医師は患者の最新の状態に基づいて診断を行うことが多く、最近性ヒューリスティクスは医療判断の自然な拡張となるかもしれません。

金融分野では、市場予測やリスク評価において、複雑な定量モデルを補完する役割を果たす可能性があります。金融市場は本質的に不安定で予測困難な環境であり、心理学的AIの得意分野と言えるでしょう。

教育分野では、学習者の理解度評価や個別化された学習推薦において、解釈可能で調整しやすいアルゴリズムが求められています。心理学的AIのアプローチは、教育者が容易に理解し、必要に応じて調整できるシステムの構築に貢献する可能性があります。

研究の限界と批判的評価

この研究にはいくつかの限界があることも認識しておく必要があります。

第一に、事例の代表性の問題があります。論文で詳細に検討されている事例は主に2つ(インフルエンザ予測と再犯予測)であり、これらが心理学的AIの一般的な有効性を代表しているかどうかは疑問です。より多様な分野での系統的な評価が必要でしょう。

第二に、比較の公正性の問題があります。Google Flu Trendsとの比較では、後者が商業的な制約や実用上の要求を満たしつつ開発されたのに対し、最近性ヒューリスティクスは純粋に予測精度の最適化を目指しています。このような異なる制約下での比較が適切かどうかは検討の余地があります。

第三に、長期的な安定性の問題があります。最近性ヒューリスティクスが特定の期間において優れた性能を示したとしても、それが将来にわたって維持されるかどうかは不明です。実際の運用においては、アルゴリズムの継続的な監視と調整が必要になるでしょう。

学際的研究としての意義

この研究の最も重要な貢献の一つは、心理学と計算科学の間の建設的な対話を促進していることです。従来、これらの分野は互いにほとんど交流することなく発展してきました。

心理学の研究者は、自分たちの研究が実際のアルゴリズム設計にどのような影響を与えうるかを十分に認識していませんでした。一方、計算科学の研究者は、人間の認知プロセスを非効率的で偏見に満ちたものとして軽視する傾向がありました。

Gigerenzer氏の研究は、これらの相互不理解を解消し、両分野の専門知識を統合することで新しい価値を創出できることを示しています。この学際的なアプローチは、他の分野の組み合わせにおいても参考になるモデルとなるでしょう。

社会的インパクトと政策的含意

心理学的AIのアプローチは、AI技術の社会実装において重要な意味を持ちます。

現在、多くの重要な意思決定がブラックボックスのアルゴリズムによって行われており、それに対する社会的な不安や不信が高まっています。透明で理解可能なアルゴリズムの開発は、このような問題を解決し、AIの社会的受容を促進する可能性があります。

また、規制当局の観点からも、心理学的AIは重要な意味を持ちます。欧州連合の一般データ保護規則(GDPR)は、個人データの透明な処理を要求しています。心理学的AIによって開発されたアルゴリズムは、このような法的要求を満たしやすい特徴を持っています。

さらに、民主社会における意思決定の透明性という観点からも、この研究は重要な貢献をしています。健康、富、保釈などの重要な決定は、その結果を受ける個人が理解できるものでなければならないという主張は、説得力があります。

結論:バランスの取れた評価と今後への期待

Gerd Gigerenzer氏の論文”Psychological AI: Designing Algorithms Informed by Human Psychology”は、人工知能分野に新しい視点を提供する刺激的な研究です。従来のAI開発における「より多くのデータ、より複雑なモデル」という方向性に対して、人間の認知プロセスから学ぶという対案を提示しています。

この研究の強みは、理論的な議論だけでなく、具体的で説得力のある事例を提供していることです。インフルエンザ予測における最近性ヒューリスティクスの成功と、再犯予測における数値の丸めの有効性は、心理学的AIの可能性を明確に示しています。また、説明可能AIという重要な課題に対して、根本的に異なるアプローチを提案していることも高く評価できます。

一方で、この研究にはいくつかの限界もあります。事例の数が限定的であること、長期的な安定性についての検証が不十分であること、そして心理学的AIが有効な領域の境界が必ずしも明確でないことなどが挙げられます。

しかし、これらの限界は研究の価値を大きく損なうものではありません。むしろ、この分野の更なる発展に向けた重要な研究課題を示しているとも言えるでしょう。

心理学的AIというアプローチは、人工知能の発展において重要な補完的役割を果たす可能性があります。すべての問題に対してこのアプローチが最適であるとは限りませんが、特定の条件下では従来の手法を大幅に上回る性能を示しうることが示されました。

今後、このアプローチがより多くの研究者によって検証され、発展させられることで、より透明で理解しやすく、そして効果的なAIシステムの構築が可能になることを期待します。また、心理学と計算科学の間の建設的な対話が継続され、両分野の知見を統合した新しい研究領域が発展することも期待されます。

最終的に、この研究が示している最も重要なメッセージは、人間の知能とコンピューターの計算能力は必ずしも競合するものではなく、適切に組み合わせることでより大きな価値を創出できるということです。この視点は、人工知能の発展における新しいパラダイムを示唆しており、今後の研究と実践に重要な指針を提供しています。


Gigerenzer, G. (2024). Psychological AI: Designing algorithms informed by human psychology. Perspectives on Psychological Science, 19(5), 839-848. https://doi.org/10.1177/17456916231180597

By 吉成 雄一郎

株式会社リンガポルタ代表取締役社長。東京電機大学教授、東海大学教授を経て現職。コロンビア大学大学院ティーチャーズカレッジ(英語教授法)、信州大学大学院工学研究科(情報工学)修了。専門は英語教授法、英語教育システム開発。 さまざまな英語学習書、英検、TOEIC 対策書、マルチメディア教材等を手がけてきた。英語e ラーニングや英語関係の教材・コンテンツの研究開発も行う。全国の大学、短期大学、高専等で使われているe ラーニングシステム「リンガポルタ」も開発した。最近ではAI による新しい教育システムの開発にも着手している。

Amazon プライム対象