はじめに:創造性という人間固有の領域への挑戦
人工知能技術の急速な発展により、これまで人間だけの能力と考えられてきた創造性の領域にも変化が生じています。ChatGPTやMidJourneyといった生成AIツールが高品質な芸術作品や文章を生み出せるようになった今、私たちは根本的な問いに直面しています。果たして創造性は本当に人間だけの特権なのでしょうか。
この疑問に対して科学的なアプローチで答えを探ろうとしたのが、フィンランドのトゥルク大学のミカ・コイヴィスト氏とノルウェーのベルゲン大学のシモーネ・グラッシーニ氏による研究”Best humans still outperform artificial intelligence in a creative divergent thinking task”です。2023年にNature系列の学術誌「Scientific Reports」に発表されたこの論文は、256名の人間参加者と3つの主要なAIチャットボットを同じ創造性課題で直接比較するという、これまでにない規模と厳密さで実施された研究として注目されています。
筆者紹介と研究の背景
この研究を主導したミカ・コイヴィスト氏は、フィンランドのトゥルク大学心理学部に所属する研究者で、認知心理学、特に創造的思考や意識の研究を専門としています。一方、共著者のシモーネ・グラッシーニ氏は、ノルウェーのベルゲン大学心理社会科学部とスタヴァンゲル大学認知・行動神経科学研究室に所属し、認知神経科学の観点から人間の思考プロセスを研究しています。両氏の専門分野の組み合わせにより、この研究は心理学的測定と神経科学的理解の双方を兼ね備えた包括的なアプローチを可能にしています。
研究の背景には、生成AI技術の社会実装が急速に進む中で生じている複数の懸念があります。まず、AI技術の進歩が雇用市場に与える影響への不安です。創造性を要する職業も含めて、従来人間が担ってきた多くの仕事がAIに置き換えられる可能性が議論されています。教育分野では、AI技術が学生の批判的思考能力を低下させるのではないかという懸念も提起されています。さらに、AI生成コンテンツの法的・倫理的取り扱いについても複雑な問題が生じています。
これらの社会的課題の根底には、人間のアイデンティティと創造性の本質に関する根本的な問いがあります。もしAIが人間と同等またはそれ以上の創造的な作品を生み出すことができるなら、創造性という概念そのものを再考する必要があるかもしれません。この研究は、こうした大きな問いに対して実証的なデータを提供することを目的としています。
研究の方法論とその妥当性
この研究の最大の特徴は、その方法論の厳密さと包括性にあります。研究者たちは、創造性研究で最も広く使用されている「代替用途課題(Alternative Uses Task, AUT)」を採用しました。この課題では、参加者に日常的な物品(ロープ、箱、鉛筆、ろうそく)の「一般的でない創造的な使い道」を考えてもらいます。例えば、箱の一般的な用途は「物を入れる」ことですが、創造的な用途としては「猫の遊園地」「楽器として使う」「アート作品の材料にする」などが考えられます。
人間の参加者は、オンラインプラットフォームProlificを通じて募集された256名の英語ネイティブスピーカーで、年齢は19歳から40歳、平均30.4歳でした。参加者の多くは英国(166名)と米国(79名)在住で、フルタイム就業者が142名、学生が44名と、多様な背景を持つグループでした。重要なのは、研究者たちが注意確認課題を設定し、適切に課題を理解できなかった参加者を除外したことです。これにより、データの質を確保しています。
一方、AI側では ChatGPT3.5、ChatGPT4、Copy.Ai の3つのチャットボットを使用しました。ここで注目すべきは、研究者たちがAIと人間の比較を公平にするために講じた細かな配慮です。AIは元来、制限なく多くのアイデアを高速で生成できますが、人間の参加者は30秒という時間制限の中で限られた数のアイデアしか出せません。そこで研究者たちは、人間参加者のアイデア数の分布を分析し(中央値と最頻値がともに3個)、AIにも同様の数のアイデアを生成するよう指示しました。
さらに、AIは詳細で長い説明を生成する傾向がありますが、人間の回答は通常1〜3語程度と簡潔です。この違いを調整するため、AIには「1〜3語で回答せよ」という制限を設けました。このような配慮により、単純な生成量や詳細さではなく、純粋な創造性を比較できる環境を整えています。
評価方法も二重の基準を設けており、客観性を高めています。まず、SemDisというプラットフォームを使用して、対象物(例:箱)と回答(例:猫の遊園地)の間の「セマンティック距離」を計算しました。これは、言葉の意味的な関連性を数値化する手法で、距離が大きいほど独創的なアイデアとみなされます。同時に、6名の人間評価者が、AI生成の回答があることを知らされずに、すべての回答を5段階で創造性評価しました。この評価者間の一致度は非常に高く(ICC = 0.88-0.93)、評価の信頼性を示しています。
結果の分析と解釈
研究結果は、表面的には「AIの勝利」を示しているように見えます。平均的なスコアでは、セマンティック距離と人間による主観評価の両方において、AIチャットボットが人間参加者を上回りました。特にChatGPT3.5とChatGPT4は、平均的なセマンティック距離スコアで人間よりも統計的に有意に高い値を示しました。主観評価でも、ChatGPT4は人間だけでなく他のAIチャットボットよりも高い評価を受けました。
しかし、この結果をより詳細に分析すると、興味深い傾向が浮かび上がります。AIチャットボットは一貫して中程度から高い創造性スコアを示しましたが、人間の回答には大きなばらつきがありました。人間の回答の中には、非常に低いスコア(主観評価で2未満)を受けたものが7%ありましたが、AIでそのような低評価を受けたものは皆無でした。これは、一部の人間参加者が課題を十分に理解していなかったか、一般的な用途や意味不明な回答を提出したことを示しています。
一方で、最高スコアに注目すると状況は一変します。セマンティック距離の最高スコアでは、AIが人間を上回ったのは Copy.Ai の鉛筆に対する回答(1.124)が人間の最高値(1.101)をわずかに超えた1例のみでした。主観評価でも、AIが人間の最高値(4.67)を上回ったのは、ChatGPT3とChatGPT4の箱に対する回答(ともに4.83)の2例だけでした。
この結果は、創造性における「平均」と「最高水準」の違いの重要性を浮き彫りにします。AIは安定して中程度の創造性を発揮し、明らかに低品質な回答を避ける能力に長けています。しかし、真に革新的で驚くべきアイデアを生み出す能力においては、優秀な人間がまだ優位に立っていることを示しています。
研究者たちは、AIの優位性を「実行機能の安定性」の観点から解釈しています。創造的思考の制御された注意理論によれば、創造性には作業記憶でのタスク目標の維持、関連性の低い概念の抑制、遠い関連性を持つ概念への注意の切り替えなどの実行機能が必要です。一部の人間参加者では、これらの機能に一時的な低下が生じたと考えられます。さらに、動機や感情的要因も人間のパフォーマンスに影響を与えた可能性があります。
一方、AIの長所は大規模なデータ構造への高速アクセス能力にあると分析されています。しかし、セマンティック距離による客観的測定では、AIの最高回答が必ずしも人間の最高回答を上回らなかったことから、単純な概念へのアクセス速度だけでは説明できない創造性の側面があることが示唆されます。
研究の限界と課題
この研究は重要な知見を提供していますが、いくつかの限界も認識する必要があります。まず、各AIチャットボットからの観察数が相対的に少ない(各11セッション)ことです。これは、特に個別のチャットボット間の比較において統計的検出力を制限しています。研究者たちは、パイロット研究でAIが回答を繰り返す傾向を観察したため、セッション数を制限したと説明していますが、より多くのデータがあれば、より詳細な分析が可能だったかもしれません。
また、AIの能力を意図的に制限したことも限界として挙げられます。AIの回答数を人間に合わせ、言葉数も制限したことで、AIの本来の能力を十分に発揮させていない可能性があります。特に、AIは数秒で多数のアイデアを生成できるにもかかわらず、人間の30秒という時間制限に合わせて評価されています。この制限が適切だったかどうかは議論の余地があります。
さらに重要な限界は、AIが実際に創造的思考を行っているのか、それとも単にデータベースから適切な回答を検索しているのかが不明であることです。研究者たち自身も認めているように、AIチャットボットは「ブラックボックス」であり、その内部プロセスは解明されていません。人間の創造性が新しい概念の組み合わせや連想によって生まれるとすれば、AIの場合は既存の知識の高度な検索と組み合わせに過ぎない可能性もあります。
研究参加者の代表性も問題です。人間参加者は主に西欧系の若年・中年成人に限られており、文化的背景や年齢層の多様性が不足しています。創造性は文化的要因に大きく影響される可能性があるため、より多様な参加者群での検証が必要です。
評価方法についても課題があります。セマンティック距離と人間による主観評価の相関は中程度(0.50-0.55)にとどまり、これらが創造性の同じ側面を測定しているとは言い切れません。特に、ChatGPT4が主観評価で高い評価を受けたにもかかわらず、セマンティック距離では他のAIと大きな差がなかったことは、評価方法間の不一致を示しています。
社会的意義と今後の展望
この研究の社会的意義は、AI技術の進歩に対する過度な楽観論と悲観論の両方に対してバランスの取れた視点を提供することにあります。一方で、AIが平均的な人間の創造性を上回る能力を示したことは、創造的職業における労働市場の変化を示唆しています。デザイン、ライティング、アイデア生成などの分野では、AIツールが人間の補助から主要な役割を担う存在へと変化する可能性があります。
しかし同時に、最も創造的な人間個人がAIと同等かそれ以上の能力を維持していることも明らかになりました。これは、高度な専門性と創造性を要する分野では、優秀な人材の価値がむしろ高まる可能性を示しています。教育の観点からは、平均的な能力の底上げよりも、個人の創造的ポテンシャルを最大限に引き出すことの重要性が浮き彫りになります。
研究結果は、AI技術の適切な活用方法についても示唆を与えています。AIは一定品質以上のアイデアを安定して提供する能力に優れているため、アイデア生成の初期段階やブレインストーミングの補助ツールとして活用することで、人間の創造的プロセスを支援できる可能性があります。一方、最終的な創造的判断や革新的なアイデアの発想においては、人間の役割が依然として重要であることも示されています。
今後の研究課題としては、まず評価方法の改善が挙げられます。現在の代替用途課題は1960年代に開発されたもので、現代の複雑な創造性の側面を十分に捉えられていない可能性があります。より包括的で現代的な創造性評価方法の開発が必要です。
また、AIと人間の創造的プロセスの違いをより深く理解する研究も重要です。脳科学的手法を用いて人間の創造的思考プロセスを解明し、AIの計算プロセスと比較することで、創造性の本質により迫ることができるかもしれません。
さらに、文化的・個人的要因が創造性に与える影響についてもより詳細な研究が必要です。異なる文化背景、年齢層、専門分野の人々を対象とした大規模な国際共同研究により、創造性の普遍的特徴と文化特異的特徴を明らかにできるでしょう。
長期的な観点では、AIと人間の協働による創造性の向上についても研究が必要です。AIを単純な競争相手として捉えるのではなく、人間の創造的能力を増強するパートナーとして活用する方法の探求が重要になります。
結論:創造性という複雑な現象への新たな理解
この研究は、人工知能と人間の創造性比較という現代的で重要なテーマに対して、厳密な実証的アプローチで取り組んだ価値ある研究です。その結果、AIが平均的な創造性において人間を上回る一方で、最高水準の創造性では優秀な人間がなお優位を保っているという複雑な状況が明らかになりました。
この発見は、創造性という現象の多面性を示しています。安定した品質でのアイデア生成能力と、真に革新的で驚くべきアイデアを生み出す能力は、異なる種類の創造性である可能性があります。AIは前者に優れ、人間は後者において独自の強みを持つと考えられます。
研究の方法論的厳密さは評価に値しますが、同時に認識された限界も今後の研究課題を明確にしています。特に、AIの内部プロセスの解明、より包括的な創造性評価方法の開発、文化的多様性を考慮した研究デザインの必要性などが浮き彫りになりました。
社会的観点からは、この研究はAI技術に対する過度な期待や恐怖の両方を和らげる効果があります。AIは確かに人間の平均的な創造性を上回る能力を示しましたが、人間の創造性を完全に置き換えるものではなく、むしろ補完的な関係を築く可能性が示されています。
教育や人材育成の分野では、この結果は個人の創造的ポテンシャルを最大化することの重要性を強調しています。AI技術の普及により、平均的な創造性よりも卓越した創造性の価値が相対的に高まる可能性があります。
最終的に、この研究は創造性に関する私たちの理解を深めると同時に、人間とAIの関係について考える新たな枠組みを提供しています。競争関係として捉えるのではなく、それぞれの強みを活かした協働関係の構築が、より豊かな創造的成果を生み出す鍵となるかもしれません。
人工知能技術の急速な発展は今後も続くでしょうが、この研究が示すように、人間の創造性、特に個人レベルでの卓越した創造性は依然として独自の価値を持っています。重要なのは、技術の進歩を恐れるのではなく、それを理解し、適切に活用しながら、人間固有の能力をさらに伸ばしていくことです。そのための科学的基盤を提供するという点で、この研究は現代社会にとって重要な意義を持つ研究といえるでしょう。
Koivisto, M., & Grassini, S. (2023). Best humans still outperform artificial intelligence in a creative divergent thinking task. Scientific Reports, 13, Article 13601. https://doi.org/10.1038/s41598-023-40858-3