はじめに―研究の位置づけと筆者について

近年、スマートフォンで気軽に使える英語学習アプリが数多く登場し、通勤電車の中や寝る前のちょっとした時間に英語を勉強する人の姿をよく見かけるようになりました。特にDuolingoのような人工知能を活用したアプリは、ゲーム感覚で学習できることから世界中で人気を集めています。しかし、こうしたアプリは本当に英語力向上に役立つのでしょうか。それとも単なる気休めに過ぎないのでしょうか。

この論文”Artificial intelligence in language instruction: impact on English learning achievement, L2 motivation, and self-regulated learning”は、中国のChongqing College of Mobile CommunicationでLing Weiという研究者が行った研究をまとめたもので、2023年11月にFrontiers in Psychology誌に掲載されました。Ling Weiは外国語教育を専門とする研究者で、特にテクノロジーを活用した言語教育に関心を持っているようです。この研究では、AIを使った英語教育が従来型の授業と比べてどれほど効果があるのかを、実際に大学生を対象にした実験を通じて検証しています。

この研究が何を調べたのか

Ling Weiが着目したのは、単に英語の成績が上がるかどうかだけではありません。もっと幅広い視点から、AI教材が学習者に与える影響を調べようとしました。具体的には三つの側面に注目しています。

第一に、英語の学習成果そのものです。文法や語彙、読解力、作文能力といった、英語学習の基本的なスキルがどれだけ向上するかを測定しました。これは最も分かりやすい効果の指標といえるでしょう。まるで健康診断で体重や血圧を測るように、客観的な数値で成果を把握しようとしたわけです。

第二に、学習意欲の変化です。英語を学ぼうとする動機づけが高まるかどうかを調べました。これは非常に重要な点です。なぜなら、どんなに優れた教材があっても、学習者本人にやる気がなければ効果は半減してしまうからです。例えば、栄養満点の食事を用意しても、食欲がなければ体に良い影響は期待できないのと似ています。

第三に、自己調整学習能力の発達です。これは少し難しい概念ですが、簡単に言えば、自分で学習の計画を立て、進捗を確認し、必要に応じて学習方法を調整する能力のことです。教師に言われたことだけをやるのではなく、自分で考えて学習を進められる力といえます。釣りに例えるなら、魚を与えてもらうのではなく、魚の釣り方を身につけるようなものです。

研究の理論的な枠組みとして、Ling WeiはVygotskyという心理学者が提唱した社会構成主義理論を採用しています。Vygotskyの理論の核心は、人は他者との相互作用を通じて学習し成長するという考え方です。従来の授業では、学生同士や教師との対話が学習を支えていました。この研究では、AIアプリがその「他者」の役割を果たせるのではないかという仮説に基づいています。

どのように調査を行ったのか

研究の参加者は、中国本土のある大学に通う60名の学生でした。彼らは19歳から24歳の間で、英語力は中級レベルと評価されていました。研究者は二つのクラスをそのまま使い、一方を実験群、もう一方を対照群として、合計30名ずつに分けました。実験群はAI教材を使った授業を受け、対照群は従来型の授業を受けるという設定です。

実験群が使ったのはDuolingoという有名な言語学習アプリです。Duolingoを選んだ理由は、その適応性と対話性が高く評価されているためです。学生たちは10週間にわたって、授業中にこのアプリを使った学習活動に参加し、さらに授業外でも週に最低2時間はアプリで練習するよう求められました。アプリは各学習者のレベルや進度に応じて問題の難易度を調整し、即座にフィードバックを提供する仕組みになっています。

一方、対照群は教科書、講義、教室での活動といった伝統的な方法で英語を学びました。文法の練習問題を解いたり、読解問題に取り組んだり、作文を書いたりという、多くの人が経験したことのある授業形式です。こちらも週に2時間以上の宿題が課されました。

データの収集方法は量的研究と質的研究を組み合わせた混合研究法を採用しています。まず、実験の前後に英語の達成度テストを実施しました。このテストは経験豊富な教師たちが作成したもので、文法、語彙、読解、作文の各分野を評価する内容になっています。信頼性を示す指標であるクロンバックのアルファ係数は0.87と高い値を示しており、テストの質が確保されていることが分かります。

学習意欲については、Mehdiyev et al.が2017年に開発した16項目の尺度を使用しました。これは態度、自信、個人的使用という三つの要素から構成されており、全体の信頼性係数は0.82でした。自己調整学習については、Brown et al.が1999年に開発した63項目からなる質問紙を用いました。こちらの信頼性係数は0.83です。

さらに、実験群の学生14名に対して半構造化インタビューを実施しました。6名が女性、8名が男性で、年齢は20歳から24歳の範囲でした。インタビューでは、AI教材を使った学習体験、感情や態度、個別化されたフィードバックの影響、モチベーションや自律性の変化などについて尋ねました。インタビューは録音され、逐語的に文字起こしされた後、テーマ分析という手法で分析されました。

何がわかったのか―結果の概要

分析の結果、実験群は対照群と比較して、調査した全ての指標において統計的に有意な改善を示しました。数字で見ると、その差は明確です。

英語学習成果のテストでは、実験開始前には両群とも同程度のスコアでした。実験群は平均43.21点、対照群は44.39点で、ほとんど差がありません。しかし10週間後、実験群の平均は73.86点まで上昇したのに対し、対照群は61.11点にとどまりました。この差は統計的に非常に有意なものでした。

学習意欲についても同様の傾向が見られました。実験前は実験群が3.12、対照群が3.04とほぼ同じでしたが、実験後には実験群が3.89、対照群が3.35となり、実験群の方が明らかに高い意欲を示しました。

自己調整学習能力でも、実験前の実験群2.89、対照群3.01という状態から、実験後には実験群3.94、対照群3.37へと変化し、やはり実験群の方が大きく向上しました。

インタビューからは、数値だけでは見えてこない学生たちの生の声が浮かび上がってきました。学生たちは八つの主要なテーマについて語っています。

まず、多くの学生がAI教材による学習を「没入感があって楽しい体験」だと表現しました。ある学生は「AIプラットフォームを使うことで、自分が学習に積極的に参加している感じがした。インタラクティブな練習問題はパズルを解くようで、リアルタイムのフィードバックが私を引きつけ続けた」と述べています。

次に、「個別化された学習経路」の価値を強調する声が多く聞かれました。「AIプラットフォームは全員を同じように扱わない。私がどこを改善する必要があるかを理解して、それに応じて導いてくれた」という感想は、個別最適化の効果を如実に示しています。

「言語能力の大幅な向上」を実感する学生も多数いました。ある学生は「以前はエッセイを書くのに苦労していたが、AIプラットフォームを使った後、作文スキルが向上した。今学期、最高得点の一つを取れた」と具体的な成果を報告しています。

「内発的動機づけと積極的な関与」も重要なテーマでした。「AIプラットフォームが私の中に火花を散らした。やらなければならないから学んでいたのではなく、本当に向上したい、言語についてもっと知りたいと思うようになった」という言葉は印象的です。

「自己調整学習における力の獲得」について、学生たちは「AIプラットフォームと一緒に、具体的な目標を設定し、学習時間を効果的に管理する方法を学んだ。自分の進歩をより管理できていると感じた」と語っています。

「前向きな学習環境と不安の軽減」も繰り返し言及されました。「以前は間違ったことを言うのではないかと恐れて、英語を話すのをためらっていた。でもAIプラットフォームのサポートがあって、安心して自分を表現できた。本当に自信がついた」という声は、心理的な安全性の重要性を示しています。

最後に、「柔軟性と利便性」が高く評価されました。「空いた時間があればいつでも英語を練習できた。学習が人生の一部のように感じられ、余計な作業ではなかった」という感想は、現代の忙しい学生たちにとってのアプリ学習の魅力を表しています。

この研究の強み

この研究にはいくつかの注目すべき強みがあります。

まず、混合研究法を採用した点です。数値データだけでなく、学生たちの生の声も集めることで、多角的な理解が可能になりました。まるで料理の味を評価する際に、栄養成分の分析だけでなく、実際に食べた人の感想も聞くようなものです。両方の視点があることで、より豊かで説得力のある知見が得られています。

次に、理論的枠組みがしっかりしている点も評価できます。Vygotskyの社会構成主義理論を基盤として、なぜAI教材が効果を持つのかを説明しようとしています。単に「効果があった」というだけでなく、「なぜ効果があったのか」を理論的に考察しようとする姿勢は学術的に重要です。

三つ目の強みは、複数の側面を同時に測定した点です。学習成果だけでなく、動機づけや自己調整学習能力という、より長期的に重要な要素も調べています。これは短期的な成績向上だけでなく、持続可能な学習習慣の形成という観点からも価値があります。

また、実際に広く使われているDuolingoという具体的なアプリを研究対象としたことも実践的な意義があります。架空のシステムや限定的な環境でしか使えないツールではなく、誰でもアクセスできるアプリを使ったことで、研究結果の実用性が高まっています。

統計的な処理も適切に行われています。混合デザインのANOVAを用いて、グループ間の差と時間経過による変化の両方を分析しています。さらに、正規性、分散の等質性、球面性などの統計的仮定を確認し、必要に応じて補正を行っている点も評価できます。

気になる点―方法論的な課題

一方で、この研究にはいくつかの気になる点もあります。

最も大きな問題は、実験群と対照群の条件が完全には統制されていない可能性があることです。実験群はDuolingoという魅力的で新しいツールを使えることから、いわゆる「新奇性効果」が働いた可能性があります。新しいおもちゃをもらった子どもが一時的に熱中するように、目新しさそのものがモチベーションを高めたのかもしれません。

また、実験群の学生たちは、自分たちが特別な実験に参加しているという意識から、より頑張ってしまう「ホーソン効果」の影響を受けた可能性もあります。病院で新しい治療法の臨床試験に参加する患者が、特別な注目を受けることで実際の治療効果以上の改善を示すことがあるのと似ています。

教師の要因も考慮する必要があります。両群で同じ教師が担当したのか、異なる教師が担当したのかが明確に書かれていません。もし異なる教師だった場合、AI教材の効果なのか、教師の質の違いなのか区別できません。同じ教師だった場合でも、新しいAI教材を使う授業に対して無意識に肯定的な態度を示してしまう「期待効果」が働いた可能性があります。

サンプルサイズも気になります。各群30名、合計60名という規模は教育研究としては決して小さくはありませんが、結果を一般化するには慎重さが必要です。特に、参加者が一つの大学の学生に限られており、しかも既存のクラスをそのまま使った「intact classes」という点は、ランダム化の不完全さを意味します。真のランダム割り付けではないため、両群の間に最初から何らかの系統的な違いがあった可能性を完全には排除できません。

測定の妥当性についても疑問があります。英語達成度テストは経験豊富な教師たちが作成したとのことですが、その内容がDuolingoで練習する課題と重なっていた可能性はないでしょうか。もしテストの内容がアプリで練習したことと似ていれば、実験群が有利になるのは当然です。これは「テストに出るところだけ勉強する」という受験勉強の問題と同じ構造です。

インタビュー参加者の選択にも偏りがある可能性があります。14名の学生がどのように選ばれたのか、詳細な説明がありません。もし好意的な体験をした学生が積極的に参加したのだとすれば、結果は実態よりも肯定的に見えてしまうでしょう。

さらに、10週間という期間は短期的な効果を見るには十分ですが、長期的な影響を評価するには不十分です。ダイエットに例えるなら、最初の2ヶ月は順調に体重が減っても、その後リバウンドすることがよくあります。同様に、AI教材の効果が持続するのか、それとも一時的なものなのかは、この研究だけでは分かりません。

結果の解釈について考える

研究者は、実験群の優れた成績をAI教材の適応的なフィードバック機能に帰しています。確かに、即座に、個別化された、的確なフィードバックを提供できることは、AIの大きな強みでしょう。人間の教師が60名の学生全員に対して、一人ひとりの弱点に合わせた即座のフィードバックを提供するのは現実的に不可能です。

しかし、本当にAI技術そのものが効果の主因なのでしょうか。別の可能性も考えられます。

一つは、単に練習量が増えたという説明です。実験群の学生たちは、楽しいアプリを使えることで、求められた週2時間以上の時間を自然と学習に費やした可能性があります。対照群の学生が宿題を義務的にこなしたのに対し、実験群はゲーム感覚で自発的により多くの時間を使ったかもしれません。

もう一つは、学習スタイルの違いです。Duolingoのような反復練習を基本とするアプリは、ある種の学習者には非常に合っていますが、概念的な理解を重視する学習者には必ずしも最適ではないかもしれません。この研究の参加者たちがたまたま前者のタイプに偏っていた可能性もあります。

また、文化的要因も考慮すべきでしょう。中国の教育文化では、反復練習と個人学習が重視される傾向があります。そうした背景を持つ学習者にとって、Duolingoのアプローチは文化的に親和性が高かった可能性があります。同じ研究を、例えばディスカッション中心の学習文化を持つ国で行った場合、結果が異なるかもしれません。

自己調整学習能力の向上については、因果関係の方向性を慎重に考える必要があります。AI教材が自己調整能力を育てたのか、それともこうした能力がもともと高い学生がAI教材をより効果的に活用できたのか、あるいはその両方なのか、この研究デザインでは判断が難しいのです。

興味深いのは、学習意欲の向上です。しかし、これも10週間という短期間での測定である点に注意が必要です。新しいゲームに夢中になるのと、長期的な学習習慣として定着するのとは別の話です。最初の熱意がいつまで続くのか、それとも徐々に飽きてしまうのかは、この研究だけでは分かりません。

実践への示唆

この研究結果から、教育現場への示唆を考えてみましょう。

まず、AI教材の全面的な導入を急ぐべきだという結論には慎重であるべきです。この研究は一つの大学の、特定の条件下での、短期間の効果を示したに過ぎません。教育は複雑で、文脈に依存するものです。ある環境で成功した方法が、別の環境でも同じように機能するとは限りません。

むしろ、この研究が示唆しているのは、AI教材の「適切な活用方法」を探ることの重要性です。Duolingoは万能薬ではなく、一つの有用なツールとして、従来の授業と組み合わせて使うのが現実的でしょう。料理に例えるなら、新しい調理器具が登場したからといって、従来の包丁やフライパンが不要になるわけではないのと同じです。

学習者の個別性を尊重することも重要です。この研究では全体として実験群の成績が良かったものの、個々の学生を見れば、AI教材が合う人と合わない人がいたはずです。学習スタイルや性格、背景知識などによって、最適な学習方法は異なります。一律にAI教材を押し付けるのではなく、選択肢の一つとして提供することが望ましいでしょう。

教師の役割についても考える必要があります。この研究は、AI教材が教師を不要にするという証拠ではありません。むしろ、インタビューでは学生たちが「導いてくれた」「サポートがあった」と述べており、何らかの人的支援があったことがうかがえます。AI教材は教師の代替物ではなく、教師の負担を軽減し、より高度な指導に集中できるようにする補助具として位置づけるべきでしょう。

評価の多面性も示唆されています。この研究が学習成果だけでなく、意欲や自己調整能力も測定したことは重要です。テストの点数という分かりやすい指標だけで教育の成否を判断するのは危険です。長期的に見れば、自ら学び続ける力や、学習への前向きな態度の方が、一時的な成績よりも重要かもしれません。

コスト面の現実も忘れてはなりません。Duolingoの基本機能は無料ですが、学校で組織的に導入する場合は有料プランが必要になるでしょう。また、学生全員がスマートフォンやタブレットを持っているとは限りません。デジタル格差への配慮なしにAI教材を導入すれば、かえって教育の不平等を拡大してしまう恐れがあります。

まとめ―この研究から何を学ぶか

Ling Weiによるこの研究は、AI教材の可能性を示す興味深い事例です。10週間という限られた期間であっても、適切に活用されたAI教材が学習成果、意欲、自己調整能力の向上に寄与する可能性があることを、量的・質的データの両面から示しました。

特に注目すべきは、学生たちの生の声です。彼らが語った体験は、単なる数値では捉えきれない学習の質的な変化を浮き彫りにしています。楽しさ、個別化、安心感、柔軟性といった要素が、効果的な学習環境を作る上で重要であることを再確認させてくれます。

しかし同時に、この研究には方法論的な制約があり、結果の解釈には慎重さが求められます。新奇性効果、サンプルの限定性、短期間の測定、統制の不完全さといった問題を考慮すると、「AI教材が絶対に優れている」という単純な結論を導くことはできません。

むしろ、この研究が私たちに教えてくれるのは、問いを立てることの重要性です。どのような条件下で、どのような学習者に対して、どのような目的のために、AI教材が有効なのか。こうした具体的な問いに答えるために、さらなる研究が必要です。

教育とは本質的に人間的な営みです。学習は単に情報を頭に詰め込むことではなく、理解し、考え、創造する過程です。AI技術は確かに強力なツールですが、それを使うのも、その効果を享受するのも、結局は人間です。

最後に、この研究の著者自身が認めているように、より長期的な追跡調査、より多様な学習者集団での検証、より厳密な実験統制が今後の課題として残されています。教育研究は一つの研究で完結するものではなく、多くの研究が積み重なって、徐々に確かな知見が形成されていくものです。

私たちは、この研究を盲目的に信じるのでも、全面的に否定するのでもなく、批判的に読み解き、そこから学べることを学び、改善できることを改善していく姿勢が大切でしょう。それこそが、まさに自己調整学習の精神そのものなのかもしれません。


Wei, L. (2023). Artificial intelligence in language instruction: impact on English learning achievement, L2 motivation, and self-regulated learning. Frontiers in Psychology, 14, Article 1261955. https://doi.org/10.3389/fpsyg.2023.1261955

By 吉成 雄一郎

株式会社リンガポルタ代表取締役社長。東京電機大学教授、東海大学教授を経て現職。コロンビア大学大学院ティーチャーズカレッジ(英語教授法)、信州大学大学院工学研究科(情報工学)修了。専門は英語教授法、英語教育システム開発。 さまざまな英語学習書、英検、TOEIC 対策書、マルチメディア教材等を手がけてきた。英語e ラーニングや英語関係の教材・コンテンツの研究開発も行う。全国の大学、短期大学、高専等で使われているe ラーニングシステム「リンガポルタ」も開発した。最近ではAI による新しい教育システムの開発にも着手している。

📖新刊情報|英語教育学海外論文解説: 海外の研究をサクッと解説』が刊行されました!
海外の上位ランクの学術雑誌に掲載された論文の中から、毎月のテーマに合わせて論文を厳選、そのポイントや限界などをわかりやすく解説。最新の研究をサクッと学べる英語教育学の論文解説書です。
 第3号:「英語教育における語彙指導」 ▶第2号:「英語教育と評価を考える」 創刊号:「AIは英語学習を加速するのか」

X
Amazon プライム対象