はじめに―「わかっているのにできない」という壁
英語の授業で、こんな光景を見たことはないでしょうか。文法の説明を聞けばうなずく生徒が、いざスピーキングの場になると途端に固まってしまう。あるいは、熱心にノートを取っていたはずの学生が、学期の途中からぱたりと意欲をなくしてしまう。知識の問題ではない。気持ちの問題です。英語教育の現場で長年働いてきた方なら、この「わかっているのにできない」という壁の前で何度も立ち止まった経験があるはずです。
この壁の正体を心理学的に説明する概念が「情意要因(affective factors)」です。モチベーション、学習への関与(エンゲージメント)、目標言語に対する態度、そして学習不安―これらが、言語習得の成否を大きく左右することは、第二言語習得研究の分野では広く認められてきました。問題は、それをどうすれば改善できるか、という実践的な問いです。
そこに切り込んだのが、今回取り上げる論文です。サウジアラビアのImam Mohammad Ibn Saud Islamic Universityに所属するLujain AlTwijriとTalal Musaed Alghizziによる “Investigating the Integration of Artificial Intelligence in English as Foreign Language Classes for Enhancing Learners’ Affective Factors: A Systematic Review”(Heliyon, 2024)は、EFL(外国語としての英語)教育においてAIの統合が情意要因にどのような効果をもたらすかを、体系的に整理した意欲的なレビュー論文です。
筆者たちは誰か―研究の背景を押さえる
AlTwijriは応用言語学の博士課程在籍者で、TESOL資格も持つ実践的な研究者です。指導教員のAlghizziは同大学の准教授であり、翻訳・言語スキル・テクノロジー統合を専門としています。サウジアラビアという文脈は重要です。英語を外国語として学ぶ環境であり、文化的・宗教的背景からくる学習不安も存在しやすい。そういった文脈を持つ研究者が、AI統合の情意的効果という問いを立てたことは、決して偶然ではありません。
論文が掲載されたHeliyonはElsevier傘下のオープンアクセスジャーナルで、分野横断的な査読論文を掲載します。教育学・応用言語学の専門誌ではありませんが、AI×教育というテーマの学際性を考えれば、一定の合理性がある選択と言えるでしょう。
何を、どのように調べたのか―方法の概要
著者たちは、IEEE、Wiley、Web of Science、Sage、ProQuest、Springer、Science Directという主要データベースを横断的に検索し、最終的に21本の論文を分析対象に絞り込みました。2017年から2023年の間に発表されたもので、EFLの高等教育の文脈でAIを統合し、情意要因を測定した実証的研究に限っています。
分析の枠組みは、モチベーション・エンゲージメント・態度・学習不安という四つの情意要因です。そしてそれぞれについて、どのAIツールが、どのような文脈で、どのような効果をもたらしたかを整理しています。方法論としてはWolfswinkelらのグラウンデッド・セオリーに基づく体系的レビューを採用しており、手続きの透明性は確保されています。
方法論上、最も特徴的なのは対象の絞り込みの厳しさです。64本の候補論文から21本への絞り込みは約67%の除外率を意味します。K-12教育、四技能や文法・語彙の向上を主目的とするもの、オピニオン記事などが排除されました。この厳格さは評価できますが、同時に後述するように、いくつかの問題も生じています。
何がわかったのか―結果の読み方
21本の研究のうち、20本が「ポジティブ」な結果を報告しています。AIの統合はモチベーションを高め、エンゲージメントを促し、態度を好転させ、不安を軽減した―という方向性で、ほぼ一致しています。壮観と言えば壮観ですが、ここで少し立ち止まる必要があります。
最も多く使われたAIツールはチャットボットでした。ChatGPT、Duolingo、Mondly、Andyのようなアプリ、あるいは研究者が独自に開発したMOCA(Motivational Online Conversational Agent)やTPBOTといったシステムが活用されました。これらは主に「学習パートナー」「個別チューター」「ティーチングアシスタント」の三つの役割を担っており、意味交渉、インタラクティブな会話練習、フィードバック提供などに用いられています。
チャットボットがモチベーションに効くのは、なぜでしょうか。研究者たちはいくつかの理由を挙げています。まず「いつでも・どこでも」使えるアクセシビリティ。次に、人間の教師と異なり、何度間違えても批判しないという安心感。さらに、ゲーム的な要素が学習をエンタテインメント化するという側面もあります。学習不安の軽減については、人間相手では恥ずかしくて試みられない発話練習を、機械相手なら気軽にできるという点が大きいようです。
例外として目を引くのは、El Shazly(2021)の研究です。チャットボットを使ったスピーキング活動が、不安の軽減ではなく不安の増大をもたらしたという結果でした。事前テストでの平均不安スコア15.3が事後では16.8に上昇しています。この「外れ値」は非常に示唆的です。AIとのやり取りが常に心理的安全をもたらすとは限らない。場合によっては、新しいテクノロジーへの慣れのなさや、AIへの期待値とのギャップが、むしろストレスを生む可能性もある。この一点だけでも、現場への応用に慎重さが求められることを教えてくれます。
論文の評価―何が優れ、何が足りないか
この論文の最大の貢献は、散在していた実証研究を一カ所に整理し、EFL×AI×情意要因という三つの交差点における研究地図を描いた点にあります。特にこのテーマに関する体系的レビューが希少であることを考えれば、「とりあえずここを見ればいい」という基点を提供した意義は小さくありません。
ただし、研究者の目で読むと、いくつかの限界が見えてきます。
まず「出版バイアス」の問題です。20対1という圧倒的なポジティブ結果の偏りは、ネガティブな結果や有意差なしの結果が学術誌に掲載されにくいという構造的な問題を反映している可能性があります。ポジティブな結果しか出版されないとすれば、そのレビューもポジティブな結論になるのは当然です。著者たちも「AI統合に関する体系的レビューは希少」と認めていますが、それは同時に、この分野における知識の偏りを意味します。
次に、サンプルサイズの問題があります。21本中の多くが数十人規模の小規模研究であり、一般化には慎重さが必要です。最大でもHuang et al.(2023)の102名です。しかも実験期間が短い。2回の50分セッションから、長くても3ヶ月程度の準実験デザインが多く、長期的な効果については何も言えません。
また、参加者の均質性も気になります。中国、日本、台湾、サウジアラビア、エジプトなどさまざまな国が対象になっているものの、文化的・制度的文脈の違いが分析に十分に反映されているとは言い難い。AIへの親和性は文化によって大きく異なります。テクノロジーリテラシーの差も考慮されていません。
さらに重大な問題として、「AI統合の質」の不均一さがあります。ChatGPTを単に使わせただけの研究と、研究者が精密に設計したMOCAの効果を同列に「AI統合」として扱うのは、比較可能性の観点から問題です。包丁を使った料理と、高級シェフのフルコースを同じ「調理」として評価するようなものです。レビューとしての統合的考察の深さがもう少し欲しいところです。
日本の英語教育への示唆―現場が受け取るべきメッセージ
さて、ここからが日本の読者にとって最も関心の高い部分かもしれません。
日本の英語教育は今、大きな転換点にあります。文部科学省はGIGAスクール構想を推進し、生成AIの教育利用に関するガイドラインも整備されてきました。英語教育においても、AIツールの活用は避けて通れない課題となっています。そこでこの論文が示す知見は、いくつかの点で示唆的です。
一つ目は「スピーキング不安」への応用可能性です。日本の英語学習者に特徴的な課題の一つが、スピーキングへの強い抵抗感です。「間違えたら恥ずかしい」「笑われたくない」という感情は、集団主義的文化との親和性もあって、日本の教室に根強く残っています。チャットボットとの会話練習が不安を低減するという知見は、この文脈でとりわけ有効かもしれません。実際、Hsu et al.(2021)が開発したTPBOT(LINEプラットフォーム上で動作するチャットボット)の研究では、スピーキング不安の軽減が報告されています。LINEが日本で広く普及していることを考えると、同様のアプローチは日本の文脈でも応用しやすいと思われます。
二つ目は「モチベーションの維持」という観点からの再解釈です。日本の大学英語教育では、受験を終えた学生が「もう英語は終わり」とシャッターを下ろしてしまうという現象が広く見られます。外発的モチベーションが高校までで消費され、内発的モチベーションが育っていないのです。この論文が取り上げる自己決定理論の枠組みで言えば、AIによる自律的・個別化された学習環境が内発的モチベーションの育成につながる可能性があります。Annamalai et al.(2023)のDuolingo・Mondlyを使った研究が自律性を促したという知見は、この観点から日本の教育者にとっても参考になるはずです。
三つ目は、教師の役割に関する示唆です。論文は重要な点を指摘しています―AIは教師の代替ではなく補完であるという認識です。AIが学習パートナーや個別チューターとして機能するとしても、学習者の情動を読み取り、動機付けの文脈を設計し、文化的な配慮をしながら学習を促進するのは、やはり人間の教師です。日本の教育現場でAI活用が広がるとき、この「補完性」の原則を忘れないことは、特に重要です。
関連研究との対比―この論文はどこに位置づけられるか
近年、AIと教育に関する体系的レビューは急増しています。Zawacki-Richterら(2019)の包括的なレビューは、高等教育におけるAI研究の偏りを明らかにし、「教育者の視点からの研究が不足している」と指摘しました。Zhai(2023)のレビューは対話型AIが相互行為能力に与える影響に焦点を当てましたが、情意要因は主な対象ではありませんでした。Ouyang et al.(2022)はオンライン高等教育でのAIを概観しましたが、同じく情意的側面は周辺的な扱いでした。
この文脈において、AlTwijriとAlghizziの論文の「情意要因」への絞り込みは差別化要因として機能しています。認知的・技能的側面に偏りがちなAI×教育研究において、気持ちの問題に正面から向き合った点は評価できます。ただし、体系的レビューとしての方法論的厳密さという点では、PRISMA(Preferred Reporting Items for Systematic Reviews and Meta-Analyses)ガイドラインに沿ったフローチャートや、コーダー間信頼性(inter-rater reliability)の報告が欠けており、再現性の観点からやや物足りなさを感じます。
見落とされている問い―論文が触れていないこと
優れた批評は、論文が「言っていないこと」にも目を向けます。
この論文には、ジェンダーの視点がほぼ完全に欠けています。言語学習とジェンダーの関係は、応用言語学において重要なテーマです。AI学習ツールへの親和性がジェンダーによって異なる可能性、あるいはAIとのインタラクションがジェンダーによって異なる情意的反応を生む可能性は、今後の研究が取り組むべき問いです。
また、AIの種類の変化への言及も不十分です。2017年のチャットボットと2023年のChatGPTは、技術的に全く異なるものです。大規模言語モデル(LLM)の登場以前と以降では、AIが提供できる対話の質が根本的に変わっています。その変化を無視して「チャットボット全般の効果」として語ることには、一定の危険があります。
さらに、倫理的問題への踏み込みが浅い点も気になります。論文はUNESCOの「北京コンセンサス」に触れはしますが、学習データのプライバシー、AIへの依存のリスク、あるいはアルゴリズムによる学習評価の公平性といった具体的な問題には踏み込んでいません。日本では個人情報保護の観点からAI教育ツールの導入に慎重な機関も多く、この議論はより詳細に展開されてよかったと思います。
学術的な貢献をどう評価するか
結論として、この論文は「最初の一歩」として評価されるべきものです。体系的レビューとしての完成度は発展途上であり、メタ分析による効果量の算出や、より厳密な質評価ツールの適用(例えばMixed Methods Appraisal Toolなど)があれば、知見の重みはさらに増したでしょう。しかしながら、EFL×情意要因×AIという交差点に旗を立て、「ここには研究の余地がある」と示した功績は無視できません。
論文自体が自覚しているように、この分野はまだ「初期段階」にあります。21本という分析対象の少なさは、研究の不足を示すと同時に、これからの可能性の広さを示してもいます。
おわりに―「気持ち」の問題を軽視しないために
英語教育に携わっていると、しばしば思うことがあります。学習者はスキルを学んでいるのではなく、自分自身の言語的自己像を育てているのだと。その育ちを支えるのが、情意要因です。不安が高ければ、どれほど良い教材を使っても効果は限定的です。逆に、「もっとやってみたい」というモチベーションが芽生えれば、多少の教授法の粗さは乗り越えられます。
AIはその「気持ち」に働きかけるツールとして、確かな可能性を持っています。ただし、それは万能薬ではない。El Shazlyの研究が示すように、文脈次第では逆効果になることもある。そしてこの論文が示すように、その可能性と限界を検証する研究はまだ始まったばかりです。
日本の英語教育者にとって、この論文の最も重要なメッセージは、おそらくこうです―AIを使う前に、あなたの学習者の「気持ち」はどこにあるかを問いなさい。そしてAIがその「気持ち」をどう変えるかを、丁寧に観察し続けなさい。テクノロジーは手段であって、目的ではありません。学習者の情意が豊かになるとき、英語学習は初めて本物の広がりを持つのです。
AlTwijri, L., & Alghizzi, T. M. (2024). Investigating the integration of artificial intelligence in English as foreign language classes for enhancing learners’ affective factors: A systematic review. Heliyon, 10, e31053. https://doi.org/10.1016/j.heliyon.2024.e31053
