はじめに―この論文が問いかけること

英語の授業で「もっと話す練習がしたい」と思ったことはないでしょうか。日本でも中国でも、外国語としての英語教育が抱える最大の悩みのひとつは、授業時間の制約と大人数のクラスによって、一人ひとりが実際に話せる時間があまりにも少ないという現実です。教師がどれほど熱心であっても、30人や40人のクラスで全員に十分な発話機会を与えることは、物理的にほぼ不可能です。

この問題に対して、「生成AI(Generative AI、以下GenAI)を会話相手にすればどうか」という発想から生まれたのが、今回紹介する論文”Examining generative AI–mediated informal digital learning of English practices with social cognitive theory: A mixed-methods study”です。香港教育大学のLihang Guan、Ellen Yue Zhang、Michelle Mingyue Guの3名による研究で、2025年に学術誌『ReCALL』(欧州コンピュータ支援言語学習学会の機関誌)に掲載されました。タイトルを直訳すれば「社会認知理論を用いた生成AI媒介型インフォーマル・デジタル英語学習実践の検討―混合研究法による研究」となります。

論文の核心は、授業時間外に生徒が自分でAIと英語で会話するという「インフォーマルな学習」が、実際に英語スピーキング能力を向上させるかどうかを、10週間の実験を通じて検証したことです。結果は「向上する」でした。しかし、それだけで終わらない複雑さと誠実さがこの研究にはあります。以下、その内容と意義、そして課題を丁寧に見ていきましょう。

著者たちはどんな研究者か

Lihang Guanは香港教育大学英語教育学科の博士課程院生で、コンピュータ支援言語学習やAIと教育の関係を研究テーマにしています。Ellen Yue Zhangは同大学の助教授で、第二言語習得の動機づけ、アイデンティティ、CALL(コンピュータ支援言語学習)、IDLEなどを専門としており、『TESOL Quarterly』や『System』など権威ある学術誌に多数の論文を発表しています。そして研究の主軸のひとりであるMichelle Mingyue Guは教授かつ同大学大学院長を務めており、スタンフォード大学による「世界トップ2%の科学者」にも選出された実績を持ちます。この3名が協力したことで、理論的な深みと実証的な厳密さが両立した研究が生まれました。

重要な概念の整理―「IDLE」とは何か

この論文を読む上でまず理解しておきたいのが「IDLE(Informal Digital Learning of English)」という概念です。これは「インフォーマルなデジタル英語学習」と訳せますが、平たく言えば「授業外で、自分から自発的に行うデジタルメディアを使った英語学習」のことです。YouTubeで英語の動画を見たり、英語のポッドキャストを聞いたり、英語でゲームをしたりすることも含まれます。

IDLEはさらに「エクストラカリキュラー(課外活動的)」と「エクストラミュラル(課外自律的)」に分けられます。前者は教師に勧められた課題として行うもの、後者は完全に自分の意志で行うものです。本研究では、教師がGenAIを使った会話練習を授業外の課題として課す「エクストラカリキュラー的IDLE」の効果を検証しています。

理論的な土台―なぜ「社会認知理論」を使うのか

研究の理論的基盤として採用されているのがAlbert Banduraの社会認知理論(Social Cognitive Theory、SCT)です。Banduraの理論で特に重要なのは「モデリングと模倣」という概念で、人間は他者の行動を観察し模倣することで学習を深めるというものです。語学学習においても、ネイティブスピーカーや優れた話者の英語を聞いて真似ることが上達の近道であることは、多くの人が経験的に知っていることでしょう。GenAIはまさにこの「模倣すべきモデル」として機能できるのではないか―これが研究の根本的な仮説です。

加えてTPACK(技術的教授内容知識)というフレームワークも使われています。これは教師が「技術的知識」「教授知識」「内容知識」の3つをどう統合するかを考えるための枠組みです。ただし本研究は、教師のITスキルに依存しない学習形態として、生徒自身がGenAIを使うIDLE実践に注目することで、TPACK問題を「迂回」する方法を探っています。つまり「教師がAIを使いこなせなくても、生徒が自分でAIを使えばいい」という発想の転換が背景にあるわけです。

実験のデザイン―何を、どうやって調べたのか

中国大陸のSTEM系大学に通う大学生47名(18歳から21歳)を対象に、実験群(23名)と統制群(24名)に分けて10週間の実験が行われました。実験開始前に両群のIELTS形式のスピーキングテストを実施し、両群に統計的な差がないことを確認しています(p=0.851)。

実験群は、iFlytek Spark(讯飞星火)という中国製のGenAIツールに搭載された「English interpreter Lucy」という仮想コンパニオンと毎週2時間、英語で会話の練習をしました。Lucyはスピーキングの練習問題に対する回答を聞いて、フィードバックと模範解答を音声・テキスト両方で提供してくれます。統制群は、IELTSスコア9点という高得点を持つ経験豊富な教師と同じく毎週2時間、対面で練習しました。

10週後(11週目)に再びIELTS形式のポストテストを実施し、2名の採点者が独立して採点しました。採点者間の信頼係数は0.93と高く、結果の信頼性は担保されています。さらに12週目と14週目には半構造化インタビューを行い、量的データだけではわからない生徒の内面的な経験や行動の理由を質的に分析しています。この「量的データ+質的データ」という混合研究法(mixed-methods)の採用が、研究に厚みを与えています。

結果―AIは本当に役に立ったのか

量的分析の結果は明快でした。両群ともにスピーキング能力が有意に向上しましたが(p<0.01)、実験群(GenAI使用)のほうが統制群(教師指導)よりも有意に高い伸びを示しました(p<0.05)。具体的には、統制群の平均スコアが5.19から5.54へ、実験群が5.22から5.85へと上昇しており、0.3ポイント以上の差が生まれています。IELTSのスケールで0.3ポイントというのは小さく見えるかもしれませんが、10週間という短期間の変化としては無視できない数字です。

では、なぜGenAIのほうが効果的だったのでしょうか。インタビューデータが示した理由は大きく2つあります。

ひとつは「練習量の差」です。教師主導のクラスでは、24人のクラスで一人が答えられる問題は1セッションあたりわずか4、5問でした(I4の発言)。ところがGenAIとの練習では、2時間丸ごと自分のために使えます。「まるで無料の個別指導を受けているみたい」(I1の発言)という感想は、この構造的な格差を的確に表しています。Banduraの言う「観察と模倣の機会」が、実験群では圧倒的に多かったのです。

もうひとつは「心理的安全性」です。教師の前では緊張してしまい、うまく話せないという生徒が少なくありませんでした。特に内向的だったり英語が苦手だったりする生徒は、「評価されている」という感覚から不安を感じ、発言機会が減るという悪循環に陥りがちです。GenAIには判断も偏見もないため、緊張せず長く話せるようになったという報告が多数ありました(I11の発言など)。これは「意志疎通への意欲(Willingness to Communicate)」の向上として学術的に説明されており、先行研究とも一致しています。

不都合な真実―GenAIは「楽しい」わけではない

しかしこの研究が特に誠実だと思うのは、GenAIの限界についても踏み込んで論じている点です。14週目のインタビューで、実験群の学生のほぼ全員が「実験終了後もGenAIで自主練習を続けているか」と聞かれ、続けられていないと答えました。理由として挙がったのが「環境の変化」と「楽しくない」という2点です。

宿舎で話すと周囲の迷惑になる、自習室が空いていないという物理的な問題もありましたが、より根本的な問題は「GenAIとの会話は便利だが、楽しくない」という感情的な側面でした。「内容が刺激的でなく、フィードバックの形式もインタラクティブでない」(I7)、「Lucyが自分の意図を理解してくれないときに、違うプロンプトを考えなければならないのが疲れた。教師だったらそんなことは起きない」(I11)という声は、現時点のGenAI技術の限界を率直に示しています。

研究者たちはこれを「内発的動機づけの欠如」として理論的に位置づけています。Deci&RyanのSelf-Determination Theory(自己決定理論)に基づけば、人が自律的に行動を継続するには「有能感」「自律性」「関係性」の3つが必要です。GenAIは有能感と自律性は支援できますが、人間との真正な「関係性」の代替にはなりえない―そのことをデータが示しているわけです。

日本の英語教育への示唆

この研究結果は、日本の英語教育現場にとって示唆に富んでいます。日本もまた、中国と同様に「授業内での発話時間の少なさ」「英語を話すことへの強い不安」「教師のICTリテラシー格差」という問題を共有しているからです。

文部科学省は「話す力」の育成を英語教育の重点課題として掲げていますが、教室では依然として文法や読解が中心になりがちです。GenAIを課外の自主練習に活用するというアプローチは、授業の構造を根本から変えなくても実施できる現実的な手段として注目に値します。特に「教師がAIを使いこなせなくても生徒が使えばよい」というTPACKの迂回という発想は、ICT研修が追いつかない現場の教師にとって実践的なヒントになります。

一方で注意が必要なのは、本研究の対象が「すでにGenAIの使用経験がある大学生」である点です。日本の中高生への適用可能性を考えると、デジタルリテラシーの指導や心理的安全性の確保といった準備が必要になるでしょう。また、本研究で使用されたiFlytek SparkはChatGPTやGeminiとは異なる中国製のツールであり、日本の学習者に最適なGenAIツールを選定するためのさらなる実証研究が求められます。

関連研究との対比

Yang et al.(2022)の先行研究はAIチャットボットをEFL授業内で活用した効果を示しており、本研究はその知見を「授業外」に拡張したものと位置づけられます。また、Tai(2024)はAIアシスタントが授業外でのスピーキング能力向上に有効であることを示していますが、本研究はそこに「質的データによる心理的メカニズムの解明」というレイヤーを加えています。

Liu et al.(2024a)はAIを使ったIDLE実践を混合研究法で分析しており、本研究と方法論的に近いですが、Liu et al.がGenAI使用の実態と動機に焦点を当てたのに対して、本研究は縦断的な実験デザインによって「効果の有無」を実証した点に独自性があります。

先行研究の多くが相関研究や質的研究にとどまっていた中で、本研究が対照実験デザインを用いている点は方法論的に一歩前進しています。ただし47名という小さなサンプルサイズ、STEMに特化した単一大学、中国という特定の文化的文脈といった制約は、結果の一般化可能性を慎重に評価すべき理由になります。

批判的考察―この研究の強みと弱点

本研究の最大の強みは、理論・方法・実践のバランスの良さにあります。SCTというしっかりした理論枠組みのもとで、量的・質的双方のデータを組み合わせ、実験効果の「なぜ」に迫ろうとしている姿勢は評価できます。また、GenAIの効果を無条件に称賛するのではなく、継続使用の困難さという不都合な面も誠実に報告している点は、学術論文として信頼性を高めています。

一方でいくつかの課題も指摘できます。まず、実験期間中は教師やGenAIとの練習が「課題」として課されていたため、その構造的な強制力が結果に影響している可能性があります。完全に自由意志に基づくIDLE実践と同等に扱うことには慎重さが必要です。次に、統制群の教師とGenAIの「質」の違いを統制しきれているかという疑問もあります。教師は人間であり、会話の流れに応じて柔軟に対応できるのに対して、GenAIは依然としてプロンプトへの依存度が高い。この非対称性を完全に排除するのは難しいでしょう。

さらに、インタビューに応じたのが主にボランティアであった点(特に12週目インタビューは13名のみ)も、サンプルの偏りという観点から注意が必要です。自発的に参加した人は、GenAIに対してより積極的な見方を持っている可能性があります。

まとめ―AIと人間の役割分担を考える

本研究が最終的に示しているのは、「GenAIは英語のスピーキング練習において有効なツールである」という結論とともに、「それだけで十分ではない」という慎重な現実認識です。Guan、Zhang、Guの3名は、GenAIを教師の代替物として提案しているわけではなく、教師が担いきれない部分―特に個別の練習機会の量的確保と心理的安全性の提供―をGenAIが補完できると論じています。

英語学習において大切なのは、話す量だけでなく、話したいという気持ちと、続けられる仕組みです。GenAIは前者の「量」と「心理的ハードル」については確かに貢献できます。しかし、人と話す喜び、相手に伝わったときの達成感、ときに笑いが生まれる会話の温かさ――そうした体験を継続の原動力とする学習者にとっては、GenAIはまだ「便利な道具」の域を出ていないのかもしれません。

それでも、どこでも・何時でも・誰でも英語練習の機会を得られるという点では、GenAIは語学教育における格差解消の一手段として真剣に検討する価値があります。特に教育資源の少ない地域や、人前で話すことへの強い不安を持つ学習者にとっては、GenAIとの練習が英語学習への扉を開く入口になりうる。その可能性を実証データで支えたこの研究は、これからの語学教育を考えるうえで欠かせない一石を投じています。


Guan, L., Zhang, E. Y., & Gu, M. M. (2025). Examining generative AI–mediated informal digital learning of English practices with social cognitive theory: A mixed-methods study. ReCALL, 37(3), 315–331. https://doi.org/10.1017/S0958344024000259

 

By 吉成 雄一郎

株式会社リンガポルタ代表取締役社長。東京電機大学教授、東海大学教授を経て現職。コロンビア大学大学院ティーチャーズカレッジ(英語教授法)、信州大学大学院工学研究科(情報工学)修了。専門は英語教授法、英語教育システム開発。 さまざまな英語学習書、英検、TOEIC 対策書、マルチメディア教材等を手がけてきた。英語eラーニングや英語関係の教材・コンテンツの研究開発も行う。全国の大学、短期大学、高専等で使われているeラーニングシステム「リンガポルタ」も開発した。最近ではAIによる新しい教育システムの開発にも着手している。

📖新刊情報|英語教育学海外論文解説 VOL.5』が刊行されました!▶第5号特集「読み・書き・対話を深化させるトランスランゲージングの可能性」

X
Amazon プライム対象