論文の概要と著者について
今回取り上げるのは、2025年1月に学術誌Heliyonに掲載された “A Systematic Review of Corpus-Based Instruction in EFL Classroom”(Dandan Li, Nooreen Noordin, Lilliati Ismail, Dan Cao)です。著者らはマレーシア・プトラ大学(Universiti Putra Malaysia)の言語・人文教育学科に所属しており、英語教育における実証研究の体系化を専門としています。第一著者のDandan Liは中国出身の研究者で、外国語としての英語教育(EFL)とコーパス言語学の接点に関心を持ち、本論文はその集大成的な位置づけにあります。
コーパス(corpus)とは、実際の言語使用から収集された大規模なテキストのデータベースのことです。インターネット上の文章、新聞記事、日常会話の書き起こしなど、生きた言語の用例が膨大に蓄積されており、研究者や教師はそれを使って「ネイティブスピーカーが実際にどんな言葉をどんな文脈で使っているか」を調べることができます。コーパスを活用した授業、すなわちCorpus-Based Instruction(以下CBI)は、教師が辞書や文法書の「作られた例文」に頼るのではなく、生きた言語データを教材として提示する指導法です。
PRISMAガイドラインに沿った堅実な方法論
この論文の最も評価できる点のひとつは、方法論の透明性です。著者らはPRISMA(Preferred Reporting Items for Systematic Reviews and Meta-Analyses)ガイドラインに厳密に従い、ScienceDirect、Google Scholar、Wiley Online Library、Web of Scienceという4つの主要データベースを横断的に検索しています。2011年から2024年にかけて公刊された研究を対象とし、最終的に44本の実証研究が分析対象として選定されました。
最初の検索では約3万2,000件のヒットがあったそうです。そこから自動ツールによるスクリーニング、アブストラクト精査、全文精査という段階を経て44本に絞り込んでいく過程は、文献レビューのお手本のような手続きと言えます。恣意的な文献選択を防ぐために独立した複数の研究者が査読・確認を行っており、研究の信頼性を担保する工夫が随所に見られます。ただし、この点については後でいくつか留保すべき点も指摘します。
研究の地理的偏りという問題
分析結果を見ていくと、まず地理的な分布に目が止まります。44本のうち、中国からの研究が11本、トルコからが8本と突出しており、これだけで全体の43%を占めています。エジプト、韓国、タイ、イランなどが2本前後続き、日本は1本のみです。
これは何を意味するでしょうか。中国とトルコは、それぞれ独自の事情からEFL教育への投資を拡大しており、コーパスを活用した授業研究が活発に行われています。一方で日本の英語教育現場は、英語教育改革の波に揺れながらも、こうした実証的研究の蓄積という点では世界から一歩遅れているように見えます。日本の英語教育関係者にとって、この「1本」という数字は謙虚に受け止めるべき現実です。
さらに研究対象となった教育機関のレベルを見ると、大学などの高等教育機関が83%を占め、中等教育(中高)は17%にとどまります。CBIの研究は、主に大学の英語授業で行われてきたということです。日本で言えば、高校や中学校でのコーパス活用はほとんど手つかずの領域であり、ここに大きな研究・実践の空白があります。
「発見学習」と「学習者自律」という理論的支柱
論文が整理した理論的枠組みのうち、最も多く採用されていたのは「発見学習と学習者自律理論」(7本)でした。これは、学習者が自らコーパスデータを探索し、言語規則を帰納的に発見するという考え方です。
たとえば、日本の高校生が “make” という動詞を学ぶとします。従来の授業では「make + 目的語 + 動詞の原形」という規則を教師が説明し、練習問題をこなす流れが一般的です。CBIのアプローチでは、学習者自身がコーパスツールを使って “make” の用例を何百件も検索し、そこから自分でパターンを見つけ出します。受け取る知識ではなく、つかみ取る知識です。この違いは思ったよりずっと大きい。
この発見学習のアプローチは、Data-Driven Learning(DDL)とも密接に関連しています。DDLはTim Johnsが1991年に提唱した概念で、学習者を「言語研究者」として位置づけ、コーパスデータと直接向き合わせることで言語への気づきを促します。CBIがどちらかと言えば教師主導であるのに対し、DDLは学習者主導という色彩が強く、両者は補完関係にあります。論文はこの関係を丁寧に整理しており、概念の混乱を避ける上で有益な貢献をしています。
「手を動かす」か「手を動かさないか」―授業活動の二分法
論文は授業活動を「Hands-on(直接型)DDL」と「Hands-off(間接型)DDL」に分類しています。前者は学習者がコーパスツールを自分で操作してデータを探索する活動、後者はコーパスから抽出・加工された教材を使うものの、学習者自身はコーパスを直接操作しない授業です。
44本の研究のうち、直接型を採用した研究が21本、間接型が10本(残りは両方を組み合わせたもの)でした。直接型の方が多いのは興味深い点です。コーパスツールを自ら使わせることで、言語への主体的なかかわりが生まれるという考え方が、研究者の間で支持されていることがわかります。
しかし、ここで立ち止まって考えてほしいのです。「直接型の方が多い」ということは、「直接型の方が効果が高い」とは必ずしも言えません。後述しますが、学習者の習熟度や技術的スキルによっては、直接型が逆効果になることもあります。この点について論文はある程度触れていますが、分析が表面的にとどまっている感は否めません。
AntConcとCOCAが示すツールの現実
使用されたコーパスツールのうち、最も多く使われていたのはAntConcという無料のコンコーダンサー(用例検索ソフト)で、6本の研究に登場します。British National Corpus(BNC)やCorpus of Contemporary American English(COCA)といった大規模コーパスも複数の研究で使われており、Sketch EngineやLextutorといったオンラインツールも登場します。
AntConcは日本の大学でも一部の熱心な教員が使っています。無料でダウンロードでき、テキストを読み込んでキーワードの用例を一覧表示できる優れたツールです。しかし、英語のインターフェースに慣れていない学習者には、最初のハードルが相当高い。筆者自身、英語教育の研修でAntConcを紹介した際に、参加した現職教員から「これを生徒に使わせるには自分がまず使えるようにならないと」という声が多く上がったことを思い出します。ツールの存在を知ることと、授業で使いこなすことの間には、見えない深い溝があります。
研究方法の構成とその含意
研究方法の分布を見ると、混合研究法(量的+質的)が56%、量的研究が33%、質的研究が11%でした。混合研究法の多さは、CBIの効果を測るには数値だけでなく学習者の経験や認識も捉える必要があるという判断を反映しています。これは妥当な傾向です。
一方で、質的研究が11%にとどまるという点はやや気になります。コーパスを使ってみた学習者が「どんなことに気づき、どんな困難を感じ、どのように理解を深めていったか」という内面的プロセスは、数値では捉えきれません。質的アプローチによる緻密な事例研究が、今後さらに必要とされる分野だと言えます。
CBI最大の強み―本物の言語との出会い
論文が整理したCBIの利点の中で、最も重要なのは「本物の言語データへのアクセス」です。これは一見当たり前のことのようで、実は英語教育において長年の課題に直結しています。
日本の英語教科書の例文は、しばしば人工的で使用頻度の低い表現を含んでいます。”I go to school by bus every day.” という文は文法的には正しいですが、実際の英語使用においてこれほど直截的な言い方をするネイティブスピーカーはほとんどいません。コーパスを使えば、”I usually take the bus to school.” のような、より自然な表現に出会うことができます。
研究によれば、CBIは語彙習得、コロケーション(語の共起関係)の学習、ライティングスキル、文法意識の向上などに効果をあげています。特にコロケーション学習での効果は複数の研究で確認されており、”make a mistake”(○)と “do a mistake”(×)のような誤りを自ら発見・修正できるようになるという報告は、日本の学習者にも直接関連する知見です。
見過ごせない課題―上位学習者への偏りと技術的ハードル
しかし、この論文が誠実に認めているように、CBIには重大な課題もあります。まず、研究対象の83%が大学生以上であることが示すように、CBIの恩恵を受けているのは主に言語習熟度の高い学習者です。コーパスデータを自力で検索・分析するためには、ある程度の英語力と情報リテラシーが前提として必要だからです。
初中級レベルの学習者にとって、コーパスの画面に並ぶ何百もの用例は、宝の山ではなく情報の洪水に見えてしまいます。Moon and Ohの研究が指摘するように、DDLに不慣れな学習者にとってデータ分析の認知的負担は相当なものです。これは日本の中高生に当てはめると、より深刻な問題になります。英語が得意でない生徒に対して、コーパスツールを使わせることがかえって学習意欲を削ぐリスクは、十分に現実的です。
次に、教師側の問題があります。Çalışkan and Gönenや Qouraらの研究が示すように、コーパスツールへの習熟と指導設計の能力が教師に求められますが、これが十分に備わっていない場合、授業は機能しません。日本の現状を考えると、多くの英語教員がコーパスを「聞いたことはあるが使ったことはない」という状態にあります。養成課程でCBIが扱われることはまだ例外的であり、現職研修でも普及は緩やかです。
技術的・インフラ的な問題も見逃せません。タブレットやPCが1人1台配備されていない環境、学校のネットワークに制限がある環境では、コーパスツールを授業に組み込むこと自体が難しいです。GIGAスクール構想で端末整備が進んだ日本の学校現場でも、実際に使えるネットワーク環境やソフトウェアの整備はまだ道半ばです。
関連研究との対比―先行レビューを超えているか
CBIやDDLに関する先行のレビュー研究としては、BoultonとCesarの2015年のメタ分析や、VyatkinaとBoulton(2017年)によるLanguage Learning & Technology誌上の概観などが知られています。これらと比較したとき、本論文の貢献は何でしょうか。
まず、2011年から2024年という直近13年間をカバーしている点が新鮮です。特に2020年以降のパンデミック後の研究動向も視野に入れており、2021年の論文数の回復(5本)は、オンライン授業の普及がCBIへの関心を高めた可能性を示唆しています。オンライン環境ではコーパスツールへのアクセスが容易になるという逆説的なメリットがあるからです。
ただし、本論文が既存のレビューを大きく超える独自の分析フレームを提示しているかというと、やや疑問が残ります。「研究の文脈」「理論的基盤」「授業活動の種類」「研究方法」「コーパスツール」「影響因子」「利点と課題」という7つの問いは包括的ですが、それぞれの分析が記述的なレベルにとどまっており、「なぜそうなのか」という解釈的な深みがあと一歩欲しいところです。
たとえば、中国とトルコで研究が集中している理由については、「両国でCBIへの関与が高い」と述べるにとどまっており、両国の英語教育政策との関連や、研究資金の流れといった構造的要因への分析がありません。こうした背景を掘り下げることで、他国での普及条件についての考察がより豊かになったはずです。
日本の英語教育現場への示唆
日本の英語教育関係者にとって、この論文から何を受け取るべきでしょうか。いくつかの重要な示唆があります。
まず、コーパスは「使わせる」ものである前に「教師自身が使い慣れる」ものでなければならないという点です。Jamal らが指摘するように、教師がコーパスの可能性を理解していなければ、授業への組み込みは起きません。大学の英語教員養成課程や現職研修において、コーパスリテラシーを育てるための時間と場所を確保することが急務です。
次に、間接型CBIの可能性を再評価すべきだという点です。学習者にコーパスを直接操作させることが難しい環境では、教師がコーパスから抽出した例文や用例を教材として提示するだけでも、教科書の「作られた例文」とは質的に異なるインプットを提供できます。Youssef の研究が示すように、このアプローチでも語彙習得に効果があります。コーパスを「教室に直接持ち込む」ことと、「コーパスが背後にある教材を使う」ことは別物ですが、後者から始めることには現実的な意義があります。
さらに、GIGAスクール端末の活用という観点から見れば、COCAやSketch EngineといったWebベースのコーパスツールを授業に取り入れる条件は、5年前よりずっと整っています。特に高校の「英語コミュニケーション」や「論理・表現」の授業で、ライティング指導にCBIを組み込む試みは、十分に現実的な選択肢です。生徒が書いた英文のコロケーションをコーパスで確認するフィードバック活動などは、難易度を調整しながら段階的に導入できます。
論文の限界とそれが語ること
著者自身が認める限界として、英語論文のみを対象としていること、特定のデータベースに限定していること、そして急速な技術変化によってツールや手法が陳腐化する可能性があることが挙げられています。これらは体系的レビューに共通する宿命的な制約です。
加えて、独自の懸念として指摘しておきたいのは、44本の研究の質のばらつきです。PRISMAに従った選定プロセスは透明性を確保していますが、実験デザインの厳密さ、サンプルサイズ、効果量の報告の有無などは研究によって大きく異なります。「混合研究法56%」という数字も、それぞれの研究が質的・量的データをどのように統合したかを見ていくと、かなりの多様性があるはずです。今後のレビューでは、研究の質的評価をより明示的に組み込んだ分析が求められます。
また、ChatGPTをはじめとする生成AIの登場が英語教育に与えている影響を考えると、コーパス活用の意義はより複雑な位相に入ってきています。AIが瞬時に「自然な英語の用例」を生成できる時代に、コーパスを検索する手間をかける必要があるのかという問いに、研究者はいずれ答えなければなりません。この論文の対象期間(2011〜2024年)には生成AIの台頭期も含まれますが、この点への言及はありません。次なるレビューでは避けて通れない論点です。
結語―「知っている」から「使える」へ
この論文は、CBIという指導法の現状を誠実に、そして包括的に描いています。コーパスが英語教育にもたらす可能性は実証的に支持されており、語彙、文法、ライティング、学習者自律など多岐にわたる効果が確認されています。同時に、技術的な複雑さ、教師のスキル不足、低習熟度学習者への対応という課題もまた、現実の壁として立ちふさがっています。
日本の英語教育は今、学習指導要領改訂の波、大学入試改革の余震、生成AI登場という三重の変化にさらされています。その中でCBIが示す本質的な方向性、つまり「本物の言語に学習者を向き合わせ、自ら気づかせ、自律的に学ばせる」という考え方は、時代を超えた価値を持っています。コーパスを使うかどうかよりも、そのような学びをどう設計するかが問われているのです。
コーパスを「知っている」教師は増えています。それが「使える」に、さらには「うまく教えられる」に変わっていくとき、この論文が整理した知見は確かな足場になるでしょう。英語教育研究者にとっても、現場の実践者にとっても、本論文は手元に置いておく価値のある一本です。
Li, D., Noordin, N., Ismail, L., & Cao, D. (2025). A systematic review of corpus-based instruction in EFL classroom. Heliyon, 11, e42016. https://doi.org/10.1016/j.heliyon.2025.e42016
