はじめに:技術と教育の接点を探る
シドニー大学のHongzhi Yangと韓国・淑明女子大学校のSuna Kyunによる本論文は、人工知能を活用した言語学習の実態を丁寧に整理した研究です。2022年に発表されたこの文献レビューは、15年間にわたる研究成果をまとめ上げた、いわば「棚卸し」のような仕事といえます。
著者たちが注目したのは、AI技術が教育現場でどのように使われているのか、そして実際にどんな効果があったのかという、極めて実践的な問いです。世の中ではAIがあらゆる分野で話題になっていますが、教育の世界でも例外ではありません。特に語学学習の分野では、発音チェックアプリやエッセイ添削ソフトなど、すでに多くの人が何らかの形でAI技術の恩恵を受けているはずです。
研究の設計:地道な文献探しから見えてくるもの
この研究の特徴は、活動理論という枠組みを使って、バラバラに見える研究成果を一つの見取り図にまとめ上げた点にあります。活動理論というと難しそうに聞こえますが、要するに「誰が」「何を使って」「何のために」「どんな環境で」活動するのかを整理する考え方です。
著者たちはWeb of ScienceとERICという二つのデータベースから、慎重に研究論文を選び出しました。最初は数百本の論文が候補に挙がりましたが、厳格な基準で絞り込んだ結果、最終的に25本の研究が分析対象となりました。この選定プロセスは、二人の研究者が互いにチェックし合いながら進められ、意見が一致しない場合は話し合いで決めるという、地道な作業でした。
興味深いのは、2007年という開始年の選び方です。この年はiPhoneが発売され、音声アシスタントのSiriが登場した年でもあります。つまり、AI技術が一般の人々の生活に入り込み始めた時期を起点にしているわけです。
何が明らかになったのか
分析結果からは、いくつかの明確な傾向が浮かび上がってきます。まず、研究対象の多くが大学生であること。全体の80%が大学レベルの学習者で、中学・高校生や幼稚園・小学生は少数派でした。これは、大学での研究が行いやすいという事情もあるでしょうが、AI技術がまだ成熟した学習者向けに開発されているという現実も反映しているのかもしれません。
学習言語については、68%が外国語としての英語学習でした。英語の圧倒的な存在感が改めて確認された形ですが、中国語、ロシア語、スペイン語などを対象とした研究も出てきており、徐々に多様化の兆しが見えます。
使われている技術について見ると、自動エッセイ評価システムが最も多く、全体の36%を占めていました。チャットボットや人型ロボットといった、より「対話的」な技術は合わせて16%程度です。つまり、現時点では「書いたものを評価する」というタスクにAIが最も活用されているということです。
学習のスキル別では、ライティングに関する研究が10件と最も多く、続いて学習態度(5件)、リーディング(3件)という順でした。語彙や文法、発音といった個別のスキルに関する研究は少数でした。この偏りは、自動エッセイ評価システムの研究が多いことと整合しています。
活動理論が照らし出す構図
著者たちが活動理論を使って分析したことで、いくつかの重要な点が浮き彫りになりました。一つは、学習者とAIの相互作用のほとんどが「一対一」の関係だということです。25の研究のうち、22の研究では学習者が個別にAI技術を使っており、グループで協力しながらAIを使うという設計は2件しかありませんでした。
さらに興味深いのは、教師の役割についてです。ほとんどの研究で、教師はAI技術の設定や実験の管理者としての役割に留まっており、積極的にAIを活用して授業を設計するという視点は希薄でした。AI技術を使った学習に教師が関与していたのは、わずか2件の研究だけだったのです。
この発見は、考えてみれば当然かもしれません。実験研究では、条件を統一するために教師の介入を最小限にする必要があるからです。しかし実際の教育現場では、教師の役割は不可欠です。この「実験室」と「教室」のギャップが、AI言語学習研究の大きな課題として浮かび上がってきます。
自動エッセイ評価
最も研究が多かった自動エッセイ評価について、もう少し詳しく見てみましょう。この技術は、学習者が書いたエッセイをコンピュータが自動的に採点し、フィードバックを提供するものです。中国で開発された「Pigai」というシステムが、複数の研究で取り上げられていました。
研究結果は概ね肯定的でした。自動フィードバックは学習者のライティング改善に役立ち、特に書き直しや修正を促す効果がありました。教師一人では数百人の学生のエッセイを頻繁に添削するのは不可能ですから、このような技術は確かに価値があります。
しかし同時に、限界も明らかになりました。自動評価システムは、スペルミスや文法エラーといった表面的な間違いは指摘できますが、内容の論理性や構成の良し悪しについては適切な評価ができません。ある研究では、学習者も教師も自動評価システムの信頼性に疑問を持っていることが報告されていました。トルコで行われた研究では、教師と学生の両方が、このシステムは記憶力を測定するだけで、本当の言語能力や高度な思考力を評価していないと否定的な見方を示していました。
興味深いのは、学習者の「関わり方」によって効果が大きく異なるという点です。フィードバックをただ受け取るだけでなく、感情的・認知的に深く関わった学習者ほど、より良い成果を上げていました。これは、技術そのものよりも、それをどう使うかという「使い方」の問題が重要だということを示唆しています。
ロボットとの出会い:幼い子どもたちの反応
人型ロボットを使った研究も、いくつか報告されていました。特に幼い子供たちを対象とした研究では、興味深い結果が得られています。
台湾で行われた研究では、「iRobiQ」というロボットが幼稚園児の中国語の読み書き学習を支援しました。ロボットは音と光の効果で子供たちの注意を引き、読書への興味を高めました。また、子供たち同士の協力や競争を促す効果もありました。タブレット端末と比べて、ロボットの方が子供たちの興味を引いたのです。
オランダで行われた研究では、英語学習用の人型ロボット教師が5歳児の語彙学習を支援しました。興味深いことに、男の子は授業の後、ロボットを「人間のようなもの」と見なす度合いが減りましたが、女の子では変化がありませんでした。これは、技術に対する反応に性差がある可能性を示唆しています。
一方で、ロボット技術にはまだ課題もあります。中国での研究では、ロボットが不正確な発音を認識できなかったり、複数の声を同時に聞き分けられなかったりする問題が報告されていました。また、機械的な声に違和感を覚える学習者もいました。
見えてきた課題:協働学習の不在
著者たちは、活動理論の「矛盾」という概念を使って、現状の問題点を指摘しています。最も大きな矛盾は、AI技術を使った言語学習の多くが、言語の「非コミュニケーション的」な側面、つまり発音、語彙、エラー訂正といった要素に焦点を当てている点です。
言語学習の目的は、最終的には他者とコミュニケーションを取ることにあるはずです。しかし、AI技術を使った対話や協働学習の研究は非常に少なかったのです。わずかに行われた研究では、AIが学習者の対話を促進し、協力を支援できることが示されていましたが、こうした研究は例外的でした。
この状況について、著者たちは「言語をコミュニケーションの中核として使用することは、人間の知性の核心部分であり、形式的なルールやプログラムでは捉えられない」という指摘を紹介しています。確かに、人間同士の会話には、文脈や感情、微妙なニュアンスといった、数値化や規則化が難しい要素が含まれています。
教師の不在という問題
もう一つの大きな課題は、教師の役割が軽視されていることです。ほとんどの研究で、学習者も教師も「受け身」の立場に置かれていました。実験デザインに従って指示通りに行動する対象者であり、技術と積極的に関わり、自分たちの状況に合わせて変革を起こす主体ではありませんでした。
わずかに教師が関与した研究では、興味深い結果が得られています。ギリシャで行われた研究では、教師が設定したAI会話エージェントが、学習者同士の建設的な対話を促進しました。台湾の研究でも、ロボットを使った協働読書活動が、子供たちの学習を促進しました。これらの例は、教師がAI技術を適切に「設計」し「配置」することで、より効果的な学習が実現できることを示しています。
実際の教室を考えてみれば、教師の役割は明らかです。技術をいつ、どのように使うか。個別学習と集団学習をどうバランスさせるか。技術では補えない部分をどう支援するか。こうした判断は、教師の専門性に基づいて行われるべきものです。
研究デザインの偏り
研究方法についても、偏りが見られました。25件中15件が実験デザインを採用しており、技術の「効果」を証明することに重点が置かれていました。これは科学的には妥当なアプローチですが、実際の教室での応用を考えると、限界もあります。
実験室では、条件を統一するために多くの変数を制御します。しかし教室は、多様な生徒、予測不可能な展開、様々な制約がある、はるかに複雑な環境です。実験で効果が証明された技術が、そのまま教室で機能するとは限りません。
著者たちは、より多くの研究が実際の教室環境で行われる必要があると指摘しています。また、質的研究の重要性も強調されています。数字では捉えられない学習者の経験や、教師の実践知を理解するには、インタビューや観察といった質的な方法が不可欠だからです。
研究の限界と今後の可能性
著者たちは自らの研究の限界も率直に認めています。分析対象が25件と比較的少なく、一般化には慎重であるべきだという点。質的評価を別途行わなかった点。信頼性の計算方法に改善の余地がある点。こうした謙虚な姿勢は、研究の信頼性を高めています。
今後の研究方向として、著者たちは三つの重要な提案をしています。
第一に、AI支援言語学習と正規の教師による指導を組み合わせた「混合モデル」の開発です。教室での授業と、その後のオンライン学習をどう橋渡しするか。教師がどのようにAI技術を授業に組み込むか。こうした実践的な問いに答える研究が必要です。
第二に、協働学習デザインへの注目です。学習者が仲間と協力しながらAI技術を使う状況を、もっと研究すべきだという提案です。言語学習は本質的に社会的な営みであり、他者との関わりの中で深まります。
第三に、実際の教室での応用研究の拡大です。実験室から教室へ。研究の成果を、現実の複雑な環境でどう活かすか。この問いに答えることが、技術を本当に役立つものにするために不可欠です。
Web 3.0時代の言語学習:可能性と現実のギャップ
著者たちは、インターネットの進化という大きな文脈の中で、AI言語学習の現状を位置づけています。Web 1.0は情報の一方的な配信、Web 2.0はソーシャルネットワークによる双方向の交流、そしてWeb 3.0はより構造化され知的なシステムの時代とされています。
Web 3.0の特徴は、スマートなプログラム、バーチャルコミュニティ、知的エージェントなどです。理論上、この時代の教育は、より協働的で知的なものになるはずです。しかし今回のレビューが示したのは、現実はまだそこに到達していないという事実でした。AI技術の特徴が十分に活かされておらず、特に協働学習や集団での相互作用という側面が弱いのです。
この「理想と現実のギャップ」は、技術開発だけでは埋められません。教育学的な視点、つまり「どう学ぶか」「どう教えるか」という根本的な問いと技術開発を統合する必要があります。
倫理的配慮:語られなかった論点
興味深いことに、著者たちはAI技術の倫理的な問題についての研究が非常に少なかったと指摘しています。25件中、倫理的な考察を含んでいたのは1件だけでした。
これは重要な指摘です。AI技術が教育に入り込むとき、様々な問題が生じます。学習データはどう扱われるのか。アルゴリズムに偏見はないのか。技術を使える人と使えない人の間で、格差は広がらないか。人間の教師の役割はどう変わるのか。こうした問いに、私たちはまだ十分に答えられていません。
具体的な含意:教育現場への示唆
この研究から、教育実践にとって何が言えるでしょうか。
まず、AI技術は万能ではないということです。特にエッセイの自動評価は、表面的なエラーは指摘できても、内容の深さや論理の整合性は評価できません。教師のフィードバックは依然として不可欠です。
次に、技術を「道具」として使いこなす視点が重要だということです。AIに任せられることは任せつつ、教師は内容面の指導や学習者同士の相互作用の促進に注力する。こうした役割分担が、効果的な学習環境を作ります。
また、学習者の主体性も重要です。ただフィードバックを受け取るだけでなく、それをどう活用するか考え、感情的・認知的に深く関わる姿勢が、学習成果を左右します。技術があっても、それを使う人の姿勢次第で効果は大きく変わるのです。
さらに、協働学習の可能性を探る価値があります。少数ながら成功例が報告されており、仲間と一緒にAI技術を使うことで、より豊かな学習経験が得られる可能性があります。
研究の意義:地道な整理作業の価値
この論文は、派手な新発見を報告するタイプの研究ではありません。むしろ、既存の研究を丁寧に整理し、全体像を描き出す作業です。一見地味に見えますが、こうした「見取り図」があるからこそ、次の研究の方向性が見えてきます。
活動理論という枠組みを使ったことで、バラバラに見えた研究が、一つの構造の中に位置づけられました。「誰が」「何を使って」「何のために」という基本的な問いに答えることで、見落とされていた側面、例えば教師の役割や協働学習の欠如が浮かび上がってきたのです。
また、この研究は「矛盾」や「緊張」にも注目しています。技術と人間の間、個人学習と協働学習の間、実験室と教室の間。こうした緊張関係を明らかにすることで、単純な「効果あり・なし」を超えた、より深い理解への道を開いています。
技術決定論を超えて
この研究が示唆する最も重要な点は、技術決定論を超える視点かもしれません。つまり、「良い技術があれば自動的に良い学習が起こる」という単純な考え方では不十分だということです。
技術は、それを使う人間、使われる文脈、社会的な関係性の中で、初めて意味を持ちます。同じAI技術でも、教師がどう設計するか、学習者がどう関わるか、どんな学習目標を持っているかによって、まったく異なる結果をもたらします。
活動理論の強みは、まさにこの点にあります。技術を孤立した道具としてではなく、人間の活動システムの一部として捉えることで、より現実的で総合的な理解が可能になります。
結びに代えて:バランスの探求
AI技術が言語学習に貢献できることは、この研究でも確認されました。自動フィードバックによるライティング改善、ロボットとの対話による興味の喚起、個別化された学習の提供。これらは確かに価値があります。
同時に、限界も明らかになりました。コミュニケーションの複雑さを捉えきれないこと、協働学習への応用が不十分なこと、実際の教室での検証が少ないこと。そして何より、教師の専門性の重要性が改めて浮き彫りになりました。
結局のところ、私たちが目指すべきは、技術か人間かという二項対立ではなく、両者のバランスの取れた統合なのでしょう。AIが得意なことはAIに任せ、人間にしかできないことに教師と学習者が注力する。こうした「棲み分け」と「協働」のあり方を探ることが、これからの課題です。
YangとKyunの研究は、そのための貴重な道しるべを提供してくれています。完璧な答えではないかもしれませんが、問うべき問いを明確にし、考えるべき視点を整理してくれました。それは、これから教育とテクノロジーの関係を考える人々にとって、大きな助けとなるはずです。
Yang, H., & Kyun, S. (2022). The current research trend of artificial intelligence in language learning: A systematic empirical literature review from an activity theory perspective. Australasian Journal of Educational Technology, 38(5), 180–210. https://doi.org/10.14742/ajet.7492