研究の背景―期待と現実のギャップ

近年、仮想現実(VR)技術が教育現場で注目を集めています。ヘッドセットを装着すれば、そこはもうローマの街角。目の前には生き生きとしたイタリア人のキャラクターが立っていて、あなたに話しかけてきます。こんな体験ができるなら、語学学習も楽しくなるだろうと誰もが思うでしょう。しかし、本当にそうなのでしょうか。 Cyprus University of TechnologyのIolie Nicolaidouらは、この素朴な疑問に答えるべく、興味深い研究を行いました。Nicolaidouは教育テクノロジーの専門家で、カナダのConcordia Universityで博士号を取得し、ゲーム化されたモバイルアプリケーションから拡張現実まで、様々な学習ツールの設計と評価に携わってきた研究者です。共著者のPetros Pissasは修士課程の学生として、Dimitrios Boglouは大学の語学センターの教員として、この研究”Comparing immersive Virtual Reality to mobile applications in foreign language learning in higher education: A quasi-experiment”に参加しました。 彼らが着目したのは、VRアプリケーションが本当に従来の学習方法より優れているのか、という点です。実は、VRの教育効果については、これまで十分な実証データがありませんでした。2015年にLin and Lanが行った調査では、2004年から2013年の間に主要な語学学習関連の学術誌に掲載されたVR関連の論文は、わずか3.6%にすぎなかったのです。2020年のParmaxiによる最新のレビューでも、2015年から2018年の間に発表された論文は26本のみでした。つまり、VRが「すごい」「効果的だ」と言われている割には、しっかりとしたエビデンスが不足していたわけです。

研究の設計―公平な比較を目指して

この研究では、40名のギリシャ語を母語とする大学生が参加しました。平均年齢は19.6歳で、イタリア語の知識はほとんどないか全くない学生たちです。半数はイタリア語を全く知らず、22.5%は数単語を知っている程度、22.5%は研究時に初級コースを受講中でした。 研究チームは学生を2つのグループに分けました。実験群の20名はOculus Riftというヘッドマウントディスプレイを装着してVR版のアプリケーションを使い、対照群の20名はスマートフォンやタブレットでモバイル版の同じアプリケーションを使いました。ここで重要なのは、両方のグループが同じ学習内容、同じ教材を使ったという点です。使用したのは「Mondly」という語学学習アプリケーションで、音声認識機能を備えており、VR版と拡張現実版の両方が提供されています。 学生たちは3つの導入シナリオを体験しました。タクシーの中で運転手と会話する、ホテルの受付で部屋を予約する、レストランでウェイターに注文する、という日常的な場面です。これは、たとえば海外旅行に行ったときに誰もが経験しそうな状況ですね。Mondlyは単語の繰り返しを学習方法として採用しており、実際のネイティブスピーカー同士の会話に触れることで、学習者の発音を改善する設計になっています。

測定方法―何を、どう測ったのか

研究チームは2種類のデータを収集しました。1つ目は語彙力テストで、事前と事後に実施されました。テストは10問の自由記述式で、すべてイタリア語で答えなければなりません。例えば「Da dove vieni?(どこから来ましたか?)」「Che tipo di camera vuole?(どんなタイプの部屋がいいですか?)」といった質問です。正解は1点、不完全な回答は0.5点、ギリシャ語で答えたが質問の意味は理解していると判断された場合は0.25点という採点方式でした。 2つ目のデータは、Georgiou and Kyza(2017)が開発した「没入感」を測定する質問紙でした。この質問紙は21項目からなり、7段階のリッカート尺度で回答します。測定される要素は3つあります。エンゲージメント(興味と使いやすさ)、エングロスメント(感情的な愛着と注意の集中)、そして完全な没入感(存在感とフロー体験)です。 ここで興味深いのは、この質問紙がもともとギリシャ語で開発されたか、ギリシャ語に翻訳されて検証されたものだという点です。つまり、参加者は母語で回答できるため、言語の壁による誤解が生じにくいわけです。信頼性分析の結果、この研究でのクロンバックのα係数は全体で0.87と高く、測定の信頼性が確認されました。

驚きの結果―VRは本当に優れているのか

実験の結果は、多くの人が予想していたものとは少し違っていました。

まず、VR群の語彙テストの点数を見てみましょう。事前テストの平均点は1.28点(標準偏差2.04)でしたが、事後テストでは3.78点(標準偏差2.26)に上昇しました。統計的にも有意な差があり、VRアプリケーションが語彙学習に効果的であることが示されました。 しかし、ここからが興味深いのです。モバイル群も同様に、事前テストの1.93点(標準偏差1.99)から事後テストの4.66点(標準偏差2.45)へと、統計的に有意な向上を示したのです。そして、2つのグループの事後テストの点数を比較したところ、統計的に有意な差は見られませんでした。つまり、VR版もモバイル版も、どちらも効果的だったのですが、VRがモバイルより優れているとは言えなかったのです。 これは、まるで高級レストランとファミリーレストランで同じレシピの料理を食べ比べたら、どちらもおいしかったけれど、どちらが特別においしいとは言えなかった、というような状況に似ています。雰囲気や体験の質は違うかもしれませんが、栄養価や満足度という点では差がなかった、ということです。

没入感の評価―体験の質はどうだったのか

では、学習の効果は同じでも、体験の質には差があったのでしょうか。没入感に関する質問紙の結果を見てみましょう。 VR群の学生は、エンゲージメントで平均5.96点(7点満点、標準偏差0.79)、エングロスメントで4.98点(標準偏差0.98)、完全な没入感で4.88点(標準偏差1.13)という、いずれも比較的高い評価を示しました。一方、モバイル群も、エンゲージメントで6.32点(標準偏差0.49)、エングロスメントで5.08点(標準偏差0.90)、完全な没入感で4.64点(標準偏差1.05)と、やはり高い評価でした。 統計的に有意な差が見られたのは、「使いやすさ」の項目だけでした。モバイル群の評価は6.60点(標準偏差0.40)、VR群は6.15点(標準偏差0.88)で、モバイル版の方が使いやすいと評価されたのです。これは納得できる結果です。多くの人は日常的にスマートフォンを使っていますが、VRヘッドセットを使った経験がある人は少ないでしょう。慣れ親しんだインターフェースの方が、使いやすいと感じるのは当然かもしれません。

時間の要素―効率性という観点

ここで見落としてはならない重要な点があります。VR群の学生は平均20.19分(標準偏差1.09)アプリケーションを使用したのに対し、モバイル群は平均10.36分(標準偏差0.63)しか使っていません。つまり、モバイル群は半分の時間で同じ学習成果を上げたことになります。 これは非常に重要な発見です。忙しい現代の学生にとって、時間は貴重な資源です。もし同じ学習効果が得られるなら、短時間で済む方法を選びたいと思うのは自然なことでしょう。これは、新幹線と飛行機で同じ目的地に行く場合を考えるとわかりやすいかもしれません。飛行機の方が景色は見られないかもしれませんが、時間を節約できるなら、多くの人は飛行機を選ぶでしょう。

研究の限界―慎重に解釈すべき点

Nicolaidouらも論文の中で、この研究にはいくつかの限界があることを正直に認めています。 まず、サンプルサイズが小さいという点です。各群20名、合計40名という規模では、結果の一般化には慎重になる必要があります。また、参加者は無作為抽出ではなく、便宜的抽出(利用可能な学生から選んだ)だったため、選択バイアスの可能性も否定できません。 次に、研究期間が短かったという点です。データ収集は2週間で行われ、学生たちはアプリケーションを1回だけ、10分から20分使用しただけです。これは、まるで一度だけジムに行って筋トレをして、その直後に筋力を測定したようなものです。本当に効果があるかどうかを知るには、長期的な追跡が必要でしょう。 さらに、事前テストと事後テストの間隔が短すぎたという問題があります。学生たちはアプリケーションを使った直後にテストを受けたため、短期記憶の効果が大きく影響している可能性があります。本当に語彙が定着したのか、それとも一時的に覚えていただけなのかを判断するには、数週間後や数ヶ月後に遅延事後テストを実施する必要があったでしょう。 最後に、この研究は定量的データのみに基づいており、質的データが含まれていません。学生たちがどのように感じたのか、どんな困難に直面したのか、どの部分が特に役立ったのかといった詳細な情報は得られていません。

先行研究との比較―一貫性のない結果たち

この研究を理解するには、他の研究との比較も重要です。VRと語学学習に関する先行研究は、実は一貫性のない結果を示しています。 例えば、Cheng et al.(2017)は日本語学習用のVRゲームを開発し、68名の参加者で実験を行いました。その結果、VR版で学習した学生の語彙習得数は平均4.77語、非VR版は5.39語で、むしろ非VR版の方が多かったのです(ただし統計的には有意ではありませんでした)。 一方、Tai et al.(2020)は台湾の中学1年生49名を対象に、Mondlyを使った研究を行い、VR群の語彙学習と保持が対照群よりも有意に高かったと報告しています。 また、Xie et al.(2019)は中国語学習でGoogle CardboardとExpeditionsを使用した事例研究を行いましたが、定量的なデータは提供していません。Kaplan-Rakowski and Wojdynski(2018)もMondly VRを使った研究を行いましたが、態度のみを測定し、学習成果は測定しませんでした。 この不一致は何を意味するのでしょうか。おそらく、VRの効果は、対象となる学習内容、学習者の特性、使用する具体的なアプリケーション、学習時間など、様々な要因に左右されるということでしょう。

理論的な考察―なぜVRは期待ほど効果的でなかったのか

この研究で特に興味深いのは、著者らがZhang et al.(2020)の理論を引用して、結果を説明しようとしている点です。Zhangらによれば、VRは「よく構造化された知識」の伝達には従来の教材と比べて優位性がないものの、「構造化されていない知識」の学習には効果的だといいます。 語彙学習は「よく構造化された知識」に分類されます。単語には明確な定義があり、正解が決まっています。これに対して、「構造化されていない知識」とは、例えば文化的な文脈の理解や、状況に応じた適切な言語使用の判断など、複雑で曖昧な知識を指します。 つまり、「Buongiorno(おはよう)」という単語を覚えるだけなら、VRでもスマートフォンでも変わらないかもしれません。しかし、イタリアの文化では朝の挨拶がどれほど重要か、どんな表情やジェスチャーと共に使われるか、といった複雑な文化的知識を学ぶには、VRの没入感が役立つ可能性があるわけです。

認知負荷理論の観点から

別の説明として、認知負荷理論も考えられます。Makransky et al.(2019)の研究では、VR環境での学習は没入感が高い反面、学習者にとって認知的な負荷が高くなりすぎる可能性が指摘されています。 考えてみてください。VRヘッドセットを装着すると、360度の視界が広がり、立体音響が耳に入ってきます。非常にリアルで興奮する体験ですが、同時に処理しなければならない情報も膨大です。一方、スマートフォンの画面を見ながら学習する場合、視覚的な刺激は限定的ですが、その分、学習内容に集中しやすいかもしれません。 これは、静かな図書館と賑やかなカフェで勉強するのを比べるようなものです。カフェの方が楽しいかもしれませんが、集中して覚えるには図書館の方が適している、という人も多いでしょう。

実用的な示唆―教育現場への応用

では、この研究結果は教育現場にどのような示唆を与えるのでしょうか。 まず明らかなのは、VRが必ずしも従来の学習方法より優れているわけではない、ということです。大学の語学教員が高価なVR機器への投資を検討しているなら、この研究結果は慎重な判断を促します。 同時に、VRにも価値があることは示されています。学習効果は同等でも、学生の体験は異なります。没入感の高い学習は、モチベーションの向上につながる可能性があります。授業の導入部分や、学習意欲が低下している学生への介入として、VRを活用する価値はあるかもしれません。 また、使いやすさという点でモバイルアプリケーションに軍配が上がったことも重要です。どんなに効果的な教材でも、使いにくければ学生は継続して使用しません。教育技術を選択する際には、学習効果だけでなく、実用性やアクセシビリティも考慮する必要があります。

コストパフォーマンスの問題

著者らは論文で直接触れていませんが、コストの問題も無視できません。Oculus Riftのようなヘッドマウントディスプレイは、決して安価ではありません。一方、多くの学生はすでにスマートフォンを持っています。同じ学習効果が得られるなら、追加投資の必要がないモバイル版の方が、経済的には合理的な選択かもしれません。 これは、教育における技術導入全般に言えることですが、最新の技術が必ずしも最適な解決策とは限りません。学習目標、学習者の特性、利用可能な資源、技術的なインフラなど、様々な要因を総合的に考慮する必要があります。

今後の研究への期待

Nicolaidouらは、今後の研究の方向性についても示唆しています。 第一に、「構造化されていない知識」の学習におけるVRの効果を検証することです。語彙習得ではなく、例えば文化的な文脈の理解や、実際のコミュニケーション能力の向上にVRが貢献するかどうかを調べる価値があるでしょう。 第二に、長期的な効果の検証です。数週間、数ヶ月にわたってVRやモバイルアプリを使用した場合、学習効果はどう変化するのでしょうか。また、学習内容の定着率や、実際の会話での応用能力にどのような影響があるのでしょうか。 第三に、より大規模な研究が必要です。40名という小規模なサンプルでは、結果の一般化には限界があります。異なる年齢層、異なる言語、異なる学習背景を持つ学習者で同様の研究を行うことで、より確かな結論が得られるでしょう。 第四に、質的データの収集も重要です。学生たちの声を直接聞くことで、数値だけでは見えてこない問題点や可能性が明らかになるかもしれません。

研究の意義―地道な検証の重要性

この研究の最も重要な貢献は、華やかな技術に対して冷静な検証を行ったことかもしれません。VRは確かに魅力的な技術です。しかし、教育の現場では、魅力だけでなく実際の効果が問われます。 Nicolaidouらの研究は、VRが万能ではないことを示しました。同時に、VRにも一定の価値があることも示しています。重要なのは、技術を目的化せず、学習目標に照らして適切なツールを選択することです。 たとえば、料理を作るとき、最新の調理器具があれば美味しい料理が作れるわけではありません。包丁の使い方、火加減の調整、素材の選び方など、基本的な技術と知識が重要です。同様に、語学学習でも、どんな技術を使うかより、どのように使うか、何を学ぶか、どれだけ時間をかけるかが重要なのかもしれません。

結論―バランスの取れた視点の必要性

この研究から学べることは多くあります。VRは語学学習において、モバイルアプリケーションと同等の効果を持つことが示されました。しかし、優位性は認められませんでした。使いやすさと効率性という点では、モバイルアプリケーションに利点がありました。 教育技術を選択する際には、学習効果だけでなく、コスト、使いやすさ、アクセシビリティ、学習者の特性など、多様な要因を考慮する必要があります。VRは確かに魅力的な体験を提供しますが、それだけで学習が改善されるわけではありません。 Nicolaidou、Pissas、Boglouによるこの研究は、教育技術研究の模範例と言えます。彼らは大きな期待を持たれているVR技術に対して、厳密な実験デザインで公平な評価を行いました。結果は必ずしも期待通りではありませんでしたが、それこそが科学的研究の価値です。 私たち教育者や研究者は、新しい技術に対して、期待と懐疑のバランスを保つ必要があります。可能性を探求しながらも、批判的な目を失わない。そのような姿勢が、教育の質を本当に向上させる技術の発展につながるのではないでしょうか。


Nicolaidou, I., Pissas, P., & Boglou, D. (2023). Comparing immersive Virtual Reality to mobile applications in foreign language learning in higher education: A quasi-experiment. Interactive Learning Environments, 31(4), 2001–2015. https://doi.org/10.1080/10494820.2020.1870504

By 吉成 雄一郎

株式会社リンガポルタ代表取締役社長。東京電機大学教授、東海大学教授を経て現職。コロンビア大学大学院ティーチャーズカレッジ(英語教授法)、信州大学大学院工学研究科(情報工学)修了。専門は英語教授法、英語教育システム開発。 さまざまな英語学習書、英検、TOEIC 対策書、マルチメディア教材等を手がけてきた。英語e ラーニングや英語関係の教材・コンテンツの研究開発も行う。全国の大学、短期大学、高専等で使われているe ラーニングシステム「リンガポルタ」も開発した。最近ではAI による新しい教育システムの開発にも着手している。

📖新刊情報|英語教育学海外論文解説: 海外の研究をサクッと解説』が刊行されました!
海外の上位ランクの学術雑誌に掲載された論文の中から、毎月のテーマに合わせて論文を厳選、そのポイントや限界などをわかりやすく解説。最新の研究をサクッと学べる英語教育学の論文解説書です。
 第3号:「英語教育における語彙指導」 ▶第2号:「英語教育と評価を考える」 創刊号:「AIは英語学習を加速するのか」

X
Amazon プライム対象