この論文が問いかけるもの
英語の授業で子どもたちが最初に覚えるのは、たいてい単語の羅列ではなく「How are you?」「What’s your name?」といったまとまった表現です。先生も教科書も、こうした「かたまりことば」を積極的に教えます。直感的に「こうした方がいい」とわかっている。しかし、その直感を裏づける科学的な証拠は、はたして十分にあるのでしょうか。
本論文”The impact of multi-word units in early foreign language learning and teaching contexts: A systematic review”は、まさにこの問いに正面から向き合った研究です。著者はJohannes Schulz、Catherine Hamilton、Elizabeth Wonnacott、Victoria Murphyの4名で、全員がオックスフォード大学教育学部に所属する研究者です。Schulzはマルチワードユニット(MWU)と第二言語習得の関係を専門とし、Murphyは英語追加言語(EAL)学習者の語彙発達で国際的に知られる研究者です。2023年にReview of Education誌に掲載されたこの論文は、オックスフォード大学教育学部の支援を受けてオープンアクセスで公開されています。
「マルチワードユニット(MWU)」とは、複数の単語が組み合わさったひとまとまりの言語表現のことです。「I don’t know」「My name is ___」「What do you want?」といったものがそれにあたります。日本の英語教育でいえば「チャンク」や「定型表現」「フォーミュラ」と呼ばれることもあります。こうした表現を子どもたちに意識的に教えることで、第二言語の発達が促されると多くの研究者や教育者が主張してきました。
「当たり前」を疑うことの大切さ
教育の現場では、長年の経験や勘をもとに実践が積み重なっていきます。それ自体は決して悪いことではありません。しかし、「なんとなく効果がありそう」という信念が根拠なく制度化されてしまうと、それは大きな問題になりえます。日本でも小学校英語が2020年度から正式教科となり、授業時数も増え、現場の先生方は日々試行錯誤を続けています。チャンクを使った授業、歌やチャンツ、パターン練習――どれも「効きそうだ」という直感のもとに実践されていますが、その効果を実証した研究はどのくらいあるのでしょうか。
この論文は、そのような問いへの答えを体系的に求めた「系統的レビュー(systematic review)」です。系統的レビューとは、特定のテーマに関するすべての研究を網羅的に収集し、厳格な基準で選別・評価する手法です。感覚や印象ではなく、証拠の全体像を客観的に把握しようとするものです。著者たちは、英語・ドイツ語・フランス語の計11のデータベースを対象に検索を実施し、合計2,233件の結果を得ました。
わずか2件という衝撃的な結果
2,233件のうち、最終的に「使える研究」として選ばれたのはたった2件でした。これは、研究者にとっても相当な驚きだったはずです。なにしろ著者たち自身、事前の予備調査でも「ほとんど出てこなかった」と述べているにもかかわらず、系統的レビューという最も網羅的な手法をとってもなお、この数だったのです。
選ばれた2件のうちの1本は、Balcı and Çakır(2012)によるトルコでの研究です。12〜14歳の生徒59名を対象に、コロケーション(語の共起表現)を使って語彙を教える介入群と、従来型の語彙指導を受ける統制群に分け、6週間にわたって語彙テストを実施しました。結果としては介入群の方が後半のテストや保持テストで高いスコアを示しましたが、統計的な分析に問題があることが指摘されています。具体的には、グループ間の事前テスト差の非有意性をもって「両群は同等だった」と結論づけている点や、グループ間の直接比較ではなくグループ内の変化のみを別々に分析している点が批判されています。加えて、使用されたテストはすべて非標準化のものであり、論文全体の証拠としての信頼性は「高リスク」と評価されました。
もう1本はKostka(2020)のドイツの博士論文です。フランクフルト近郊の3つの公立小学校で、Year 3(8〜9歳)の生徒18名を対象に1学年を通じた観察研究を実施しました。Kostkaは「パターン」(My favourite ___ is ___のようなオープンスロットをもつ表現)と「ルーティン」(固定した定型表現)を意識的に取り入れた授業再編成を行い、児童の発話コーパスを量的・質的に分析しました。結果は興味深いものでした。学年が進むにつれてフォーミュラ表現の使用頻度そのものは下がりましたが、語彙の多様性を示すGiraud指数は上昇しており、これは定型表現を分解・応用する能力が発達していることを示唆しています。また、質的分析では、習熟度の高い子どもほど早い段階でパターンを解体し、自由な発話に応用できるようになる様子が詳細に記録されています。しかし、統制群がないため、この変化がMWU指導の効果によるものかどうかを断定することができません。Kostka自身もこの点を明記しており、著者たちもその誠実さを評価しています。
なぜ研究がこれほど少ないのか
2,233件から2件。この落差はどこから来るのでしょうか。著者たちはいくつかの理由を挙げています。まず、MWUの定義そのものが研究者によって異なり、「フォーミュラ」「チャンク」「語彙的フレーズ」「定型表現」など概念が乱立していることが、研究の蓄積を妨げている可能性があります。また、小学校という教育現場で厳密な介入研究を行うことは、倫理的・実務的に難しい側面もあります。統制群を設けることへの保護者や学校側の抵抗、テストの標準化の困難さ、授業時数の少なさから生じる効果量の小ささなど、現実的なハードルは山積みです。
さらに、7本の韓国語論文が言語的な理由で除外されたことも見逃せません。英語の要旨だけで判断すると、これらの研究はMWU指導が子どもたちの英語力や学習動機に好影響を与えた可能性を示唆するものでした。しかし、著者チームに韓国語の専門家がおらず、翻訳の信頼性を保証できないとして除外されました。仮にこれらが含まれていたとしても9件にしかなりませんが、それでも著者たちは「研究の絶対的な不足という結論は変わらない」と述べており、その誠実さは評価できます。
理論は豊かで、実証は貧しい
この論文が際立っているのは、「研究が少ない」という事実そのものを、価値ある発見として正面から提示している点です。論文の序文では、MWUが第一言語・第二言語習得においていかに重要かを示す理論的・実証的根拠が丁寧に整理されています。Usage-Based Language(UBL)理論に基づけば、言語学習者は特定の文脈のなかで繰り返し出会う表現から規則性を帰納的に抽出していきます。これはNoam Chomskyの生成文法が主張するような「生まれつきの文法知識」に依存するのではなく、使用経験の積み重ねから言語能力が立ち上がってくるという考え方です。この観点からすれば、MWUは言語習得の「起点」であり、スロット(空欄)を埋めながら構造を学ぶための鋳型として機能するという仮説は非常に説得力があります。
1938年のKenyeres & Kenyeresの観察研究(ハンガリー語話者の娘がフランス語を学ぶ記録)から、Fillmore(1976)のメキシコ系移民の子どもたちの英語習得研究、さらにはMyles et al.(1999)の中学生フランス語学習者の研究まで、MWUが言語発達の踏み台になるという証拠はナラティブとしては豊富に存在します。それだけに、実際の授業介入を通じた実証研究が、これほど少ないという現実は衝撃的です。「理論は豊かで、実証は貧しい」――この逆転した状況を、著者たちは示しています。
日本の英語教育現場への問いかけ
この論文が日本の英語教育関係者に突きつけるメッセージは非常に重いものです。日本では2020年度から小学校3・4年生で「外国語活動」が、5・6年生では「外国語(英語)」が正式教科として導入されました。文部科学省の学習指導要領においても、「基本的なコミュニケーション能力の素地を養う」という目標のもと、表現の「型」を使った活動が奨励されています。現場の先生方は、「I like ___」「Do you like ___?」といったパターン表現を繰り返し使わせる活動を実践しています。これはまさにMWU教育の実践にほかなりません。
しかし、この研究が示すように、こうした実践の効果を厳密に検証した研究は、世界的に見てもほとんど存在しないのです。日本国内でも、チャンク活動や定型表現指導の効果を測った実証研究がどれほどあるでしょうか。教科書には「Let’s Chant!」「Let’s Listen!」などのコーナーがあり、チャンクや定型表現が豊富に盛り込まれていますが、それが子どもたちの言語能力にどのような形で、どの程度の効果をもたらしているかを調べた研究は、管見の限りきわめて少ない状況です。
また、Kostkaの研究が示すように、「習熟度の差」は重要な変数です。弱い学習者は定型表現を長くそのまま使い続け、強い学習者はより早く分解・応用の段階に移行します。これは日本のクラスルームでも日常的に観察される現象ではないでしょうか。すべての子どもに同じチャンク指導が同じように効くわけではない、というこの観察は、指導の個別化という観点からも非常に重要な示唆を含んでいます。
評価と限界、そして批判的視点
この論文の方法論的な強みとして、まず検索言語を英語・ドイツ語・フランス語に広げたこと、グレーリテラチャー(学術誌未掲載の博士論文など)を含めたこと、そしてMMAT(混合研究法評価ツール)を用いた質評価を二名の独立した評価者が実施したことが挙げられます。インターレーター信頼性(κ係数)も0.86〜1.00と高く、選定プロセスの透明性は確保されています。
一方で、いくつかの限界も指摘できます。まず、検索対象言語がヨーロッパ語圏に偏っており、日本語・中国語・アラビア語などの言語圏における研究が体系的にカバーされていません。韓国語論文が7本除外されたことを著者たちは認めていますが、アジア圏には独自の英語教育研究の蓄積があり、それが見落とされているリスクは否定できません。日本の学術誌(たとえばJACET JournalやLET Kansai Journalなど)に掲載された日本語論文も検索対象外であり、この点は日本の研究者として留意が必要です。
また、対象年齢を5〜12歳に限定していること、モノリンガルで典型発達の子どもに限定していることも、研究対象の偏りを生む可能性があります。日本の小学校英語学習者はほぼ全員が典型発達の日本語母語話者ですから、包含基準自体は適切ですが、バイリンガル環境や英語の使用機会が多い環境の子どもたちへの知見が排除されているという点は視野に入れておくべきでしょう。
これからの研究者・実践者に向けて
著者たちは論文の結論で、大規模なランダム化比較試験(RCT)が理想ではあるが、資金的・実務的困難を考えると、まずは小規模な準実験的介入研究の積み重ねが重要だと述べています。複数の小規模研究が同様の結果パターンを示すことで、大規模介入の準備が整うという視点です。これは、研究リソースの限られる日本の教育現場においても、現実的で実行可能な指針です。
加えて、Balcı and Çakırの研究への批判が示すように、測定ツールの選択は非常に重要です。単語単位の語彙テストでは、MWU指導の恩恵を十分に捉えられない可能性があります。Smith and Murphy(2015)が開発したMPT(マルチワードフレーズテスト)のような、複数語のまとまりとしての知識を測る道具の活用が求められます。日本でも、このような測定ツールの開発・適用は急務といえるでしょう。
MWU指導は「効く」のか。直感では「効きそう」で、理論でも「効くはず」なのに、実証研究がほとんどない。この答えのない問いを正直に突きつけてくれたこの論文は、研究者にとっては研究のすき間を示すロードマップであり、実践者にとっては「何を信じて教えているのか」を問い直す契機です。小学校英語教育が制度として定着しつつある日本において、MWUの有効性を検証する実証研究が日本語でも、英語でも、もっと生み出されることを強く願います。
Schulz, J., Hamilton, C., Wonnacott, E., & Murphy, V. (2023). The impact of multi-word units in early foreign language learning and teaching contexts: A systematic review. Review of Education, 11, e3413. https://doi.org/10.1002/rev3.3413
