はじめに―技術が変える言葉の学び方
外国語を学ぶとき、多くの人が最初にぶつかる壁が語彙の習得です。単語帳を眺めながら何度も繰り返し暗記する、あるいは教科書の例文を繰り返し音読する。こうした経験は誰しもあるのではないでしょうか。しかし、教室で覚えた単語を実際の場面で使おうとすると、なかなか口から出てこない。そんな経験もまた、多くの学習者に共通するものです。 本論文”Using image-to-text recognition technology to facilitate vocabulary acquisition in authentic contexts”の著者であるRustam Shadiev、Ting-Ting Wu、Yueh-Min Huangの3名は、このような従来の語彙学習が抱える問題に着目しました。Shadievは中国の南京師範大学の教授で、言語学習と異文化理解のための情報通信技術の活用を専門としています。Wuは台湾の国立雲林科技大学の准教授で、モバイル学習や知的学習システムの研究に取り組んでいます。そしてHuangは台湾の国立成功大学の特聘教授で、eラーニングやマルチメディア通信、人工知能の分野で活躍しています。こうした多様な専門性を持つ研究者たちが協力して、画像からテキストへの認識技術(Image-to-Text Recognition、以下ITR技術)を活用した新しい語彙学習の方法を提案しています。研究の背景―暗記だけでは足りない語彙学習
著者たちがまず指摘するのは、語彙が言語能力において極めて重要な要素であるという点です。Ansari and Sabouri(2016)の言葉を引用すれば、「単語は言語の構成要素である。なぜなら、単語は対象物、行為、概念を表すものであり、これらなしでは人々は意図した意味を伝えることができない」からです。これは当たり前のように聞こえますが、実は深い意味を持っています。 従来の語彙学習では、暗記が主流でした。学習者は単語リストを見ながら、母語での意味と一緒に繰り返し覚えます。Nationという研究者は、こうした暗記学習を「学習者が教材を学ぶまで何度も繰り返すこと」と定義しています。しかし問題は、このような暗記が記憶や習慣に頼るものであって、真の理解に基づくものではないという点です。Wuが指摘するように、暗記は表面的な教育実践であり、深い学習につながりません。 では、どうすれば深い学習ができるのでしょうか。著者たちは、単語を理解し長く記憶するためには、コミュニケーションの目的でその単語を使う必要があると主張します。これはKrashenの入力仮説やSwainの出力仮説といった第二言語習得理論に基づいています。つまり、言語学習には情報を受け取る「入力」と、自分で言語を産出する「出力」の両方が必要であり、そのバランスが重要だということです。本物の文脈で学ぶ意味
もう一つ、この研究で重要なのが「本物の文脈」(authentic contexts)という概念です。教室での学習はしばしば抽象的で、実際の生活場面から切り離されています。たとえば、リンゴの絵が描かれた教科書を見ながら「apple」という単語を覚えたとしても、実際にスーパーマーケットでリンゴを見たときに、その単語が自然と口から出てくるでしょうか。 Herrington and Herringtonという研究者は、本物の学習環境には3つの特徴があると述べています。第一に、知識が実生活でどのように使われるかを反映した本物の文脈を提供すること。第二に、現実世界に関連性のある本物の活動を提供すること。第三に、振り返りを促し、課題の中で本物の評価を可能にすることです。 こうした考え方は「シームレスな学習」という概念にもつながります。Wongという研究者が提唱したこの概念は、教室内での学習と教室外での学習をつなぐことの重要性を強調しています。つまり、教室で学んだことを実際の生活場面で使えるようにすることが、効果的な学習には欠かせないのです。ITR技術という新しいツール
ここで登場するのが、ITR技術です。これは一体どのような技術なのでしょうか。簡単に言えば、スマートフォンやタブレットで物の写真を撮ると、その物が何であるかを認識して、名前を教えてくれる技術です。この研究では、Googleの画像検索サービスを利用しています。従来の画像検索では、キーワードを入力して画像を探しますが、このサービスでは逆に画像をアップロードすることで、その画像に関連する情報を検索できます。 たとえば、スイカの写真を撮ってアップロードすると、「watermelon」という英語の単語とその意味が表示されます。さらに、Wikipedia百科事典からの情報など、関連するリソースも提供されます。これは、学習者が自分の興味のある対象物について、その場で学べることを意味します。 ただし、この技術にも限界があります。 他の認識技術と同様、ITRも常に正確な結果を出すわけではありません。特に、使い始めの頃は精度が低いことがあります。この研究でも、訓練開始時の認識精度は70%未満でしたが、1週間の訓練後には95%に達したと報告されています。実験の設計―ロシアの小学生40名を対象に
この研究では、ロシア語を母語とし、外国語として英語を学ぶ小学生40名が参加しました。彼らは統制群(20名)と実験群(20名)に分けられました。全員が3年間の英語学習経験を持つ初級レベルの学習者です。 実験は2週間にわたって行われ、「市場で」というトピックを扱いました。週3回、各1時間の授業が行われ、教師は果物や野菜、重さを測る、値段を計算するといった買い物に関連する英語の文法、語彙、文型を教えました。そして授業後、学習者には自分の買い物経験を説明する課題が与えられました。どこで買い物をしたか、何を買ったか、それぞれいくら使ったかを記述するというものです。 ここで2つのグループの違いが現れます。統制群の学習者は従来の方法、つまり教科書の対応する写真を見ながら語彙を学び、紙のノートに買い物経験を記述しました。一方、実験群の学習者は開発された学習システムを使いました。店や市場で対象物の写真を撮り、ITR技術を使ってその物の英語名を生成し、システム上で買い物経験を記述したのです。 評価は3回行われました。実験前のpre-test、実験直後のpost-test、そして2週間後のdelayed post-testです。各テストには3種類の問題が含まれていました。第一に、語彙を読んで正しい写真を選ぶ問題。第二に、英語の単語とロシア語の意味を対応させる問題。第三に、各単語のロシア語の意味を書く問題です。驚くべき結果―実験群の明確な優位性
結果は明確でした。pre-testでは両グループ間に統計的な差はありませんでしたが、post-testとdelayed post-testでは、実験群が統制群を大きく上回りました。しかも、この差は統計的に有意であるだけでなく、効果量(effect size)も大きく、実際的な意味でも重要な差であることが示されました。 たとえば、post-testの第3問(英語の単語のロシア語の意味を書く問題)では、統制群の平均点が10点満点中5.15点だったのに対し、実験群は7.50点でした。さらに注目すべきは、2週間後のdelayed post-testでも実験群の優位性が維持され、むしろ差が広がっていることです。第3問では、統制群が4.15点まで下がったのに対し、実験群は6.65点を維持しました。 この結果は何を意味するのでしょうか。単に実験群の学習者がより多くの単語を覚えたというだけでなく、その知識を長期的に保持できたということです。これは、ITR技術を使った学習が、単なる暗記ではなく、より深い理解と記憶の定着をもたらしたことを示唆しています。 興味深いことに、テストに含まれた37語のうち、実験群の宿題課題に登場したのは25語、統制群では16語でした。しかも、どちらの条件でも登場した語彙は、学習者が日常的に消費する一般的な食品(リンゴ、卵、パン、じゃがいも、水など)でした。これは、実験群の学習者がより多様な語彙に触れる機会があったことを意味します。学習者の声―システムへの肯定的な評価
研究者たちは、学習の効果だけでなく、学習者自身がこのシステムをどう感じたかも調査しました。アンケート調査では、4つの側面が測定されました。システムの使いやすさ、学習における有用性、将来も使いたいという意向、そして学習への満足度です。 結果は非常にポジティブでした。使いやすさについては、5段階評価で平均4.26点(標準偏差0.78)という高い評価が得られました。「システムの操作を学ぶのは簡単だ」「システムに自分がしたいことをさせるのは簡単だ」といった項目で高い同意が示されました。 有用性についてはさらに高い評価で、平均4.53点(標準偏差0.53)でした。「システムを使うことで学習の質が向上する」「システムを使うことで生産性が高まる」「システムを使うことで学習の効果が高まる」といった項目で、学習者は強く同意しています。 将来の使用意向も平均4.37点(標準偏差0.49)と高く、学習への満足度も平均4.23点(標準偏差0.42)と良好でした。「システムを使った学習は非常に興味深い」「実際の状況でシステムを使って英語のスキルを練習するのが好きだ」といった回答から、学習者がこの新しい学習方法を楽しんでいたことがうかがえます。インタビューから見えた3つのアフォーダンス
アンケートに加えて、研究者たちは実験群の学習者と個別インタビューを行いました。ここで「アフォーダンス」という概念が重要になります。これは、あるものが提供する「行為の可能性」を意味する言葉です。椅子には「座る」というアフォーダンスがあり、ドアには「開ける」「閉める」というアフォーダンスがあります。では、ITR技術を使った学習システムには、どのようなアフォーダンスがあったのでしょうか。 インタビューの分析から、3つの主要なカテゴリーが浮かび上がりました。第一は「技術的サポート」です。これには、物を認識してその名前を提供する機能、物を認識してその翻訳を提供する機能、そして物を認識して関連リソース(Wikipediaの情報など)を提供する機能が含まれます。 第二は「学習」のカテゴリーです。学習者は、新しい語彙を学べること、語彙を思い出せること、単語のスペルを学べることを挙げました。ある学習者は次のように述べています―「私たちは普通、英語の授業で教科書から学びます。その後、授業の後で教科書の課題をやらなければなりません。このような授業と宿題では、日常生活で自分のスキルや新しい知識を使うことはほとんどありません。普段、母は家事で忙しいので、私に食料品を買ってくるよう頼みます。この実験はとても役に立つと感じました。なぜなら、買い物をするときに、英語の授業で学んだスキルや新しい知識を新しい技術を使って練習できたからです。」 第三は「本物性」のカテゴリーです。学習者は、本物の文脈で学習できること、学習活動が本物であることを指摘しました。別の学習者はこう語っています―「このシステムで英語を学ぶのは面白かったです。店にいるときに、授業で学んだことに関連する自分自身のコンテンツを作る方が好きです。なぜなら、教科書の語彙、写真、翻訳は本物ではありませんが、店では本物だからです。」なぜ効果があったのか―能動的学習と無制限のリソース
研究者たちは、なぜITR技術を使った学習が効果的だったのかを考察しています。第一の理由は、実験群の学習者が統制群よりも能動的に学習したことです。これは、単語カードを眺めて暗記する受動的な学習とは対照的です。 言語を能動的に学ぶことの利点は、多くの研究者が指摘してきました。Krashenの入力仮説とSwainの出力仮説によれば、言語学習と記憶の定着は、能動的な言語入力(新しい情報の習得)と出力(関連性のある意味のあるトピックについて話したり書いたりすること)を通じて起こります。この研究では、実験群の学習者は本物の文脈で興味のある対象物を見つけ、ITRツールを使ってその名前、翻訳、スペル、関連するインターネットリソースを生成し、そして自分自身の学習コンテンツを作成することで、その情報を現実に即した文脈に適用しました。この学習活動が、能動的な学習を保証したのです。 第二の理由は、システムがあらゆる対象物を認識できるため、実験群の学習者にはトピックの語彙を学ぶ際の制限がなかったという点です。一方、統制群の学習者は教科書に提供された語彙に限定されていました。この発見は、学習者が学校の文脈外にいるときに常にさまざまな利用可能なリソースを使えること、そしてモバイル技術がさまざまな非公式な文脈で言語を学ぶことを可能にすることを示唆しています。 研究者たちが指摘するように、利用可能な学習リソースが多ければ、語彙を増やすことができます。また、興味のある単語を学ぶことは、学習の動機づけと満足度にとって有用です。実際、ある学習者はインタビューでこう述べています―「このシステムで学ぶのが好きです。なぜなら、私が写真を撮ったさまざまな果物や野菜のラベルを表示してくれるからです。興味のある物なら何でも写真を撮れます。また、学ぶ語彙に制限がありません。」長期記憶への転送―継続的な優位性の意味
もう一つ重要な発見は、学習システムを使うことが、実験群の学習者が学んだ語彙項目を長期記憶に転送するのに有益だったという点です。実験群の学習者は能動的に学び、興味のある語彙に焦点を当て、語彙を選ぶ際に制限がありませんでした。このような状況が、実験群の学習者により定期的に語彙項目を復習し、学習することを促したのです。 これは、delayed post-testの結果からも明らかです。2週間後のテストで、統制群の成績は大きく低下しましたが、実験群の成績は比較的よく保たれていました。これは、一時的な記憶ではなく、長期的な学習が起こったことを示しています。 Kimという研究者は、学習者が語彙習得の認知プロセスに高度に関与していれば、より多くの語彙を学び、それをよりよく保持すると示唆しています。この研究の結果は、この主張を裏付けるものです。システムの受容性―使いやすさと有用性の重要性
研究者たちは、モバイル学習システムを開発する際には、学習者のシステムに対する認識を調べ、受容の度合いを客観的に理解することが不可欠だと指摘しています。Venkatesh and Davisという研究者は、システムの受容性は使いやすさの認識と有用性の認識を通じて測定できると提案しました。さらに彼らは、学習者がシステムを使いやすく有用だと感じれば、将来もそれを使い続けるだろうと主張しました。 この研究の結果は、ほとんどの学習者が学習システムを受け入れ、それを使うことに満足していたことを示しています。これは特に重要です。なぜなら、このシステムはITR技術のような信号処理に基づいているからです。このようなシステムの受容性は、主に認識プロセスの精度率によるものです。 この研究では、認識精度は最初は非常に低かったものの、1週間のシステム訓練後には高い率に達しました。この達成の理由の一つは、インタビューで学習者が明らかにしました。彼らは、ITRプロセス中にいくつかの戦略を適用することで、システムのより高いITR率を保証したと述べています。たとえば、クエリに使用する画像は、技術が色、点、線、テクスチャーなどの適切な識別子を容易に分析し見つけられるように、鮮明でなければなりません。また、クエリ画像は曖昧であってはなりません。リンゴのラベルを取得したい場合、クエリ画像にはリンゴだけが含まれ、チェリーなどの他の果物は含まれないようにする必要があります。研究の限界と今後の展望
この研究には、著者自身が認めるいくつかの限界があります。まず、この新しいアプローチは買い物というトピックに基づいて適用され、学習者は果物や野菜の画像をITRプロセスに使用しました。他のトピックに適用する際には注意が必要です。なぜなら、他の物の画像をクエリとして使用すると、ITRの精度率が低下する可能性があるからです。 また、学習者はITRプロセスのために技術を使うことについて訓練を受ける必要があります。これにより、技術の強みと限界を理解し、語彙習得中にそれを十分に活用できるようになります。教育者や研究者は、ITRを使用する際により良い精度率を達成するための有用な戦略を学習者に教えるべきです。 研究期間が短かった(2週間)ことも限界の一つです。これは教室ベースの研究の現実によるものですが、より長期的な研究を行うことで、この方法論的アプローチの妥当性にさらなる厳密性を加える必要があります。また、より大きなサンプルで研究を再現することも提案されています。 研究者たちは、いくつかの有望な研究の方向性も示しています。たとえば、単語が学習者にどのように提示され、学習されるかに基づいて、ITRが単語の学習と記憶をどのように異なる方法でサポートするかの探究です。また、親の関与(その量)や課題に費やした時間が学習成果にどのように影響するかの調査も重要でしょう。この研究が教育にもたらすもの
この研究の最も重要な貢献は、ITR技術という比較的新しい技術を言語学習、特に語彙習得に適用した点にあります。研究者たちが指摘するように、言語学習の分野でのITRの使用に関する研究の欠如は、この技術の可能性が教育のために十分に活用されていないことを示唆しています。教育者や研究者が技術の潜在力とアフォーダンスを十分に理解していないため、適切または革新的な使い方ができないのかもしれません。 この研究の発見は、教育者や研究者にインスピレーションを与え、ITR技術によってサポートされる学習活動を設計する際のガイドとして役立つ可能性があります。たとえば、内容ベースの言語クラスで、生物学のコースのためにフランス語で植物について学ぶ学習者は、本物の文脈で興味のある植物の写真を撮り、そのラベルと追加の学習コンテンツを取得するためにシステムを使用できるかもしれません。 また、この研究は、教室内学習と教室外学習をつなぐシームレスな学習の重要性を具体的に示しています。学習者は教室で学び、その後、現実世界にその新しい知識を適用します。現実世界に関わるとき、学習者は教師によって作成または提供されたものを使用する代わりに、自分自身の学習コンテンツを作成できます。これは、学習者中心の教育への移行を示すものでもあります。最後に―技術と教育の新しい関係
この研究を読んで感じるのは、技術が教育を単に効率化するだけでなく、学習そのものの質を変える可能性があるということです。ITR技術は、学習者が自分の興味に基づいて、現実世界で出会う対象について学ぶことを可能にします。これは、あらかじめ決められた教科書の内容を学ぶのとは根本的に異なるアプローチです。 ただし、技術への過度な期待は禁物です。この研究でも、ITR技術の精度は最初は70%未満であり、1週間の訓練を経てようやく95%に達しました。技術を効果的に使うためには、その強みと限界を理解し、適切な戦略を学ぶ必要があります。これは、教師の役割が決してなくならないことを意味しています。むしろ、教師は技術の使い方を指導し、学習者が技術を最大限に活用できるようサポートする、新しい役割を担うことになるでしょう。 また、この研究は小規模で短期間のものであり、より大きな規模での検証や長期的な効果の確認が必要です。しかし、その限界を認めつつも、この研究が示した可能性は十分に魅力的です。語彙学習という、多くの学習者が苦労する分野において、新しい道筋が示されたことは間違いありません。今後、同様の技術を活用した研究がさらに進展し、より効果的な言語学習の方法が開発されることを期待したいと思います。Shadiev, R., Wu, T.-T., & Huang, Y.-M. (2020). Using image-to-text recognition technology to facilitate vocabulary acquisition in authentic contexts. ReCALL, 32(2), 195–212. https://doi.org/10.1017/S0958344020000038