AIスピーキングアプリにソーシャルな「ぬくもり」を加えると何が起きるか、という問いに正面から答えようとした研究があります。Xi’an Jiaotong-Liverpool University(西安交通利物浦大学)の応用言語学部に所属するBin Zouらが2023年に発表した論文 “Supporting Speaking Practice by Social Network-Based Interaction in Artificial Intelligence (AI)-Assisted Language Learning” は、中国のEFL(外国語としての英語)学習者を対象に、AIスピーキングアプリの使用にWeChat上のソーシャルインタラクションを組み合わせることで、英語スピーキング力がどう変わるかを実験的に検証したものです。査読付きのオープンアクセス誌 Sustainability に掲載され、教育テクノロジーと外国語教育の交差点に立つ研究として注目に値します。
研究の背景―AIアプリは「孤独な練習ツール」なのか
近年、英語学習アプリの進化は目覚ましく、AIが音声認識・評価システム(ASR)を用いて発音、流暢さ、文法、語彙を採点してくれるアプリが急速に普及しています。中国ではEnglish Liulishuo、IELTS Liulishuo、EAP Talk、Yidian Englishといったアプリが学生に広く使われています。これらのアプリは、いわば「疲れを知らない個別指導教員」として、何度でも繰り返し練習に付き合ってくれます。しかし、どれだけ優秀なAIであっても、そこには「他者との関わり」が存在しません。言語習得は本質的に社会的行為であるというSLAの基本原理を思えば、AI単独の練習環境には何かが足りないと感じるのは自然なことです。
Bin Zouはこれまでも、AIや音声認識技術を用いた英語教育の研究を重ねてきた研究者です。本論文での問題意識は明快で、「MALL(モバイル活用型言語学習)の文脈ではネットワーク型インタラクションの効果がある程度示されているのに、AI支援学習の文脈ではその検証が不十分だ」という点にあります。論文の目的は、AIアプリによる練習にWeChat上のソーシャルインタラクションを加えた場合、学習者の態度はどう変わるか、そしてスピーキング力は実際に向上するのか、という二点を明らかにすることです。
研究デザイン―シンプルだが誠実な実験設計
参加者は中国の複数の大学から募集された70名の大学生で、実験群(EG、35名)と統制群(CG、35名)に無作為に分けられました。実験期間は2022年の夏休み5週間で、両群ともAIスピーキングアプリを使って毎日英語スピーキングを練習するよう求められました。異なるのは、実験群のみがWeChatグループ上でさまざまなインタラクション活動に参加した点です。
具体的なインタラクション活動は五種類で、WeChatグループでの質疑応答と情報共有、WeChat Mini Programを用いた「パンチカード(打卡)」すなわち学習記録の投稿、他者の投稿へのいいねとコメント、自分のスピーキング録音をアップロードして教員から個別フィードバックを受けること、そしてTencent Docs(日本のGoogle Docsに相当)を使った語彙・表現の共同編集ドキュメント、以上です。統制群には同じAIアプリの案内と毎日のリマインダーが届きましたが、こうした双方向活動はありませんでした。
データ収集は、事前・事後テスト(SpeechAce Speaking Testを使用)、アンケート、そして実験群10名への半構造化インタビューという複数の手段で行われ、量的・質的両面からアプローチした点は評価できます。スピーキングテストの採点基準は発音・流暢さ・語彙・文法の四軸で、IELTSのバンドスコアに変換されます。
何が明らかになったか―データが語る興味深い結果
まず学習者の認識について。実験群の87.5%が「WeChatグループでの質疑応答は役に立った」と回答し、92%が「インストラクターによる毎日のリマインダーが有益だった」と答えました。パンチカード活動については88%が少なくとも一度は投稿しており、80%が「練習の動機づけになった」と感じていました。他者の投稿へのいいねやコメントについても56%が有益と評価しています。一方、自分の録音を提出して教員フィードバックを受けた学生はわずか32%にとどまり、理由として「時間がなかった」(32%)や「存在を見落とした」(24%)が挙げられています。
最も興味深いのは、「一番役に立つと思うインタラクションは何か」という問いへの回答で、「録音提出+教員フィードバック」が平均4.54点(5点満点)でダントツの1位となったことです。つまり学習者は「教員からの個別フィードバック」を最も価値あるものとして認識しているのに、実際の参加率は最も低いという逆転現象が起きています。価値があるとわかっていても行動のハードルが高いというのは、英語学習の世界ではよくある話で、この乖離をどう埋めるかが実践的な課題として浮かび上がります。
スピーキングテストの結果を見ると、事前テストの時点では両群に有意差はありませんでした(EG平均5.42点、CG平均5.24点、差は統計的に非有意)。事後テストでは実験群が平均6.58点、統制群が5.84点となり、独立標本t検定で有意差が確認されました(t = 2.06、p = 0.05、効果量は小さいが有意)。また、学習時間についても実験群は5週間で計136時間(1人あたり週1.05時間)、統制群は57.25時間(同0.63時間)と、実験群がほぼ2倍のアプリ使用時間を記録しています。パンチカードの日数についても実験群が有意に多い結果でした。
インタビューが照らし出す「コミュニティの力」
数字だけでは見えてこない側面を、インタビューデータが補っています。ある学生(S6)は「他の人がパンチカードを押しているのを見ると、仲間意識と適度なプレッシャーを感じ、自分も続けようという気になる」と語り、別の学生(S1)は「みんなが進んでいるのに自分だけ止まっていたくない」という言葉で動機を説明しています。これは、ゲーミフィケーション研究における「社会的比較」の効果に近い現象で、アプリ単体では生まれない学習継続の仕掛けがインタラクションによって生まれていることを示しています。
共同編集ドキュメントについてS6は、「一人で勉強しようとすると八十一の苦難(中国の古典小説『西遊記』の逸話)を全部一人で乗り越えなければならないが、みんなで分担すれば各自の担当は数個で済む」という比喩を使って説明しています。これはいわゆる分散認知(distributed cognition)の考え方に通じており、語彙や表現の収集・整理という負荷を集団で分散することで、個々の学習コストが下がるという論理です。
将来への提案として学生たちが口にしたのは、タスクベースのインタラクション、ハイブリッド形式(非同期+同期)、そしてコミュニティ形成の三点でした。特に非同期コミュニケーション(チャットのメッセージ遅延)への不満が複数の学生から語られており、ライブ配信やオフライン活動への期待も示されています。これはZoomやGoogle Meetなどのリアルタイム通信と組み合わせた「ハイブリッドMALL」への発展可能性を示唆していて、今後の研究への道筋を自然に開いています。
関連研究との対比―何が新しく、何が課題か
本研究が参照する先行研究として特に重要なのは、Read et al.(2021)によるFacebook連携を用いたリスニング練習の研究、Mykytiuk et al.(2022)のFacebook活用スピーキング練習の研究、Tragant et al.(2022)のWhatsAppを用いた課外言語学習の研究、そしてXu et al.(2017)のWeChatを通じた音声フィードバック研究です。これらの先行研究はいずれも、ソーシャルネットワークとモバイル学習を組み合わせることの有効性を支持しており、本研究はその知見をAI支援学習という新しい文脈に持ち込んだという点で位置づけが明確です。
一方で、先行研究との比較において本研究が超えられていない点もあります。Liu et al.(2019)は教員が積極的に関与するWeChatガイダンスとAIアプリの組み合わせを検討しましたが、統制群がなかった。本研究はその欠点を補う形で統制群を設けたという点で前進しています。しかし効果量が小さいこと(eta squared = 0.04)、実施期間が5週間と短いこと、スノーボールサンプリングという偏りのある抽出法を使っていること、そしてオンラインのみの実施であったため学生間の親密度が低かった可能性があることなど、研究の限界も著者自身が率直に認めています。
参加者数70名は決して多くはありませんが、著者たちが「10以上の異なる中国の大学から集めた」と述べていることは、ある程度の多様性を担保しようとした姿勢として評価できます。ただし、夏休み中のオンライン実験という性質上、通常の授業環境とは異なる動機や文脈が生まれていたことは否定できません。
日本の英語教育への示唆―「自律学習+つながり」のデザイン
この研究が示す知見は、日本の英語教育の現場にとっても無視できない含意を持っています。日本でも近年、スタディサプリENGLISHやSpeakbud、あるいはAI英会話アプリ全般の普及が著しく、特に大学や高校での自律学習ツールとしての導入が増えています。しかし多くの場合、これらのアプリは「個人が孤独に使うもの」として位置づけられており、クラスや仲間集団とどう接続するかというデザインは後回しになりがちです。
本研究が示すのは、AIアプリを軸にしながらも、LINEやClassroomといったコミュニケーションプラットフォームを活用してインタラクションの場を意図的に設計することが、練習の量と質を同時に高められるという可能性です。日本の学習者も、英語を話す練習の場が限られているという点では中国のEFL学習者と状況が近く、この種の「ハイブリッド設計」の有効性は十分に類推できます。
また、本研究が「教員による個別フィードバック」への高い評価と低い参加率という逆説を明らかにした点は、日本の現場でもすぐに使える問いを提供してくれます。「学生は何が役立つと思っているか」と「実際に何をするか」の間のギャップを埋めるためには、参加しやすい仕組み、たとえばフィードバックを任意ではなく課題として組み込む、提出の手順をできるだけ簡単にする、などの設計上の工夫が求められます。これは、AIアプリの機能設計だけでなく、授業設計(インストラクショナル・デザイン)の問題でもあります。
さらに、「仲間が練習しているのを見ることで自分も続けたくなる」というメカニズムは、日本の教室でも応用できます。英語スピーキングのポートフォリオをクラス内で共有し、互いにコメントし合う文化を作ることは、技術的には今日からでも始められます。完璧な英語でなくても、仲間の努力が見えることで「自分もやろう」という気持ちが生まれるなら、それはAIにはできないことを教師と仲間が担っている、ということでもあります。
学術的考察―理論的枠組みをもう少し掘り下げてほしかった
批評的な観点から言うと、本論文が惜しいのは理論的枠組みの明示が薄い点です。Vygotskyの最近接発達領域(ZPD)や社会文化理論、Longのインタラクション仮説、あるいはSelf-Determination Theory(自己決定理論)といった理論と、今回の実験デザインおよび結果をより明示的に接続することで、論文の学術的厚みはさらに増したはずです。「インタラクションは重要だ」という主張そのものは広く共有された前提であり、本研究の貢献をより鮮明にするためには、「なぜこのインタラクションがこの文脈で機能したのか」という機序の理論化が欲しいところです。
また、測定ツールとして用いたSpeechAceはPearson相関0.82という再テスト信頼性を持つと記されていますが、IELTSとの比較換算が人工的な変換に依拠しているという点では、測定の外的妥当性についてやや慎重に扱う必要があります。事前・事後テストの平均点差(EGで約1.16点の上昇、CGで約0.60点の上昇)は数字として確認できますが、それぞれの群内でのt検定結果が本文中に明示されておらず、読者が両群それぞれの「改善度」を直接比較するのが難しいという構造上の問題もあります。
研究としての誠実さと今後への展望
限界を列挙しながらも、本研究の誠実さは評価に値します。研究者自身が「実施期間が短かった」「オンラインのみだったため学生間の距離感があった」「参加者数が限られていた」と正直に認め、今後の研究への道筋を示している点は、研究の透明性という点で好ましい姿勢です。
著者たちは今後の展開として、WeChatという中国特有のプラットフォームで得られた知見を、FacebookやWhatsAppといった他のソーシャルプラットフォームに適用した研究、あるいは異なる文化的背景を持つ学習者への適用可能性の検証を求めています。これは日本のLINEやInstagramを使った類似の実験設計へと自然に応用でき、日本の研究者にとっても追試・発展研究の起点となりえます。
AIアプリは便利です。疲れないし、何度でも同じことを教えてくれます。でも、「昨日S3がパンチカードを押していたから私も今日やろう」という動機は、AIには生み出せません。この研究が静かに示しているのは、テクノロジーの力と人間のつながりの力は対立するものではなく、うまく組み合わせれば相乗効果を生むという、当たり前のようで意外と見落とされがちな真実です。英語教育に携わる人間として、その設計を考え続けることの大切さを、この論文は改めて教えてくれます。
Zou, B., Guan, X., Shao, Y., & Chen, P. (2023). Supporting speaking practice by social network-based interaction in artificial intelligence (AI)-assisted language learning. Sustainability, 15(4), 2872. https://doi.org/10.3390/su15042872
