はじめに
アメリカの公教育システムにおいて、英語を第二言語として学ぶ生徒(英語学習者)の人口は急速に増加しています。2000年以降だけでも28%の増加を記録し、現在では全米の公立学校生徒の約1割を占めるまでになりました。このような背景のもと、英語学習者向けの専門的な教材が果たして生徒の学習成果に実質的な影響を与えるのかという疑問は、教育政策立案者や現場の教育者にとって重要な関心事となっています。
今回取り上げる論文”Do English Language Development Curriculum Materials Matter for Students’ English Proficiency?”は、この疑問に対してテキサス州という大規模な教育システムを舞台に、統計学的手法を用いて明確な答えを提示しようと試みた研究です。本研究は、英語言語開発(ELD)教材の効果を州レベルで検証した初の試みとして、教育研究分野において重要な意味を持っています。
研究者の背景と動機
この研究を主導したのは、サンフランシスコ統一学区のQuỳnh Tiên Nguyên Lê氏と南カリフォルニア大学のMorgan S. Polikoff教授です。Polikoff教授は教育政策研究の第一人者として知られ、特に教科書やカリキュラムが学習成果に与える影響について長年研究を続けています。
両研究者がこの研究に取り組んだ背景には、英語学習者が直面している深刻な教育格差があります。論文中で指摘されているように、英語学習者と非英語学習者の間の学力格差は、低所得世帯と高所得世帯の生徒間の格差と同程度に大きいとされています。さらに、英語学習者は「三重の分離」状態にあるとされ、他の英語学習者、少数派、低所得家庭の生徒が集中する学校に通う傾向が強いことが知られています。
研究の法的・社会的背景
この研究の重要性を理解するには、アメリカの法的背景を知る必要があります。1981年のCastañeda v. Pickard判決により、英語学習者向けの教育プログラムは「効果的」でなければならないと法的に定められました。この判決は、教育プログラムが①健全な教育理論に基づいていること、②効果的に実施されていること、③プログラムの効果が検証されていること、の3つの条件を満たすことを義務づけています。
しかし驚くべきことに、英語言語開発教材の効果を実証的に検証した研究はほとんど存在しませんでした。数学教科書の効果については複数の研究が行われているにもかかわらず、英語学習者向けの専門教材については研究が皆無に等しい状況だったのです。この研究は、その空白を埋める重要な役割を果たしています。
研究方法の特徴と工夫
調査対象としてのテキサス州の特殊性
研究者がテキサス州を選んだ理由は単なる偶然ではありません。テキサス州は全米で2番目に多い約90万人の英語学習者を抱えており、カリフォルニア州に次ぐ規模です。さらに重要なのは、テキサス州が州レベルで教科書採択プロセスを管理している一方で、各学区に大幅な裁量権を与えている点です。これにより、同一州内でも多様な教材選択パターンが存在し、比較研究に適した環境が整っています。
実際に、研究期間中のテキサス州では7つの異なる州承認ELD教材と21の非承認教材が使用されており、この多様性が統計分析を可能にしました。他の州でこのような条件を満たすところはなく、研究の実現可能性という観点からも最適な選択だったと言えます。
準実験デザインの採用
研究者は「ローカル線形マッチング」と呼ばれる準実験デザインを採用しました。これは、真の実験(ランダム割り当て)が不可能な現実的制約の中で、因果関係を推定するための統計手法です。学校や学区が教材を「自己選択」する状況において、選択バイアスを可能な限り除去しようとする試みです。
この手法の核心は「傾向スコア」の算出にあります。研究者は28の学区指導者への詳細なインタビューを通じて、教材選択に影響する要因を特定しました。その結果、①英語学習者の人数、②学習者の学力水準、③第二言語習得に関する指導者の信念、④予算制約、⑤バイリンガル教育プログラムの有無、という5つの主要因子を発見しました。
データ収集の徹底性
研究の信頼性を支えているのは、データ収集の徹底さです。研究者は情報自由法に基づく請求を通じて教材購入データを収集し、さらに810の学区に対して個別に情報公開請求を行い、最終的にテキサス州学区の94%からデータを取得しました。この高い回収率は、研究結果の代表性を保証する重要な要素となっています。
主要な研究成果の解釈
第一の発見:教材の有無による大きな差
研究の最も重要な発見は、州承認のELD教材を全く購入しない学校の生徒が、教材を使用する学校の生徒と比較してTELPAS(英語習熟度評価システム)スコアで0.30標準偏差分低いスコアを示したことです。
この数値の意味を理解するために、教育効果の一般的な基準を参考にしましょう。教育研究では、0.25標準偏差を「小から中程度」、0.50標準偏差を「中程度」、0.80標準偏差を「大きい」効果とすることが一般的です。0.30標準偏差という数値は、教育介入としては決して小さくない効果を示しています。
さらに重要なのは、この効果が複数の異なる統計手法で一貫して確認されたことです。研究者は6種類の異なるマッチング手法を用いて分析を行い、いずれの方法でもほぼ同様の結果を得ています。これは結果の頑健性を示す重要な証拠です。
第二の発見:人気教材間の差は限定的
一方、最も人気の高い2つのELD教材(Rigby On Our Way to English と National Geographic Reach)を比較した場合、統計的に有意な差は見られませんでした。これは一見すると矛盾した結果に思えるかもしれませんが、実際には重要な示唆を含んでいます。
この結果は、「何らかの専門的なELD教材を使用することの重要性」と「特定の教材ブランドの優劣」は別の問題であることを示しています。つまり、英語学習者向けの専門教材の有無は決定的な差を生むが、州承認の教材であれば特定のブランドにこだわる必要はない、ということです。
研究手法の強みと限界
方法論上の強み
この研究の最大の強みは、選択バイアスへの対処に真摯に取り組んでいることです。研究者は傾向スコアマッチングの妥当性を確認するために、複数のバランステストを実施しています。特に、処理群(教材使用群)と対照群(教材非使用群)の共変量が十分にバランスしていることを、標準化差、分散比、仮説検定の3つの異なる基準で確認しています。
さらに、研究の信頼性を高めるために2つの「偽造テスト」を実施している点も評価に値します。第一のテストでは、ELD教材が直接影響するはずのない数学の成績を結果変数として分析し、有意な差が見られないことを確認しました。第二のテストでは、教材導入直後の時点での英語習熟度を分析し、まだ十分な効果が現れていないことを確認しました。これらのテストは、観察された効果が本当にELD教材によるものである可能性を高めています。
研究の限界と課題
しかし、この研究にも重要な限界があります。最も大きな限界は、分析対象となった学校が全体の41%に留まったことです。除外された学校の多くは、英語学習者の人数が少なすぎてTELPASスコアが報告されない学校でした。これにより、結果の一般化可能性に疑問が生じる可能性があります。
また、準実験デザインの根本的な問題として、「条件付き独立性の仮定」があります。これは、観察可能な変数をすべて統制すれば、観察できない要因は結果に影響しないという仮定です。しかし現実には、学区の教育に対する熱意や校長のリーダーシップなど、測定困難だが重要な要因が存在する可能性があります。
さらに、研究では教材の「実装度」を測定していません。同じ教材を購入していても、教師がどの程度効果的に活用しているかは学校によって大きく異なる可能性があります。この点は、結果の解釈において重要な留保条件となります。
教育現場への示唆
「良い教育だけで十分」という誤解
研究の質的データ部分で明らかになった興味深い発見の一つは、多くの教育指導者が「良い教育があれば英語学習者向けの特別な教材は不要」と考えていることです。研究者はこれを「ただ良い教育をすればよい(Just Good Teaching:JGT)」アプローチと呼んでいます。
この考え方は一見合理的に聞こえますが、英語学習者が直面する特殊な課題を見過ごす危険性があります。英語学習者は言語習得と学習内容の理解を同時に行わなければならず、母語話者とは質的に異なる支援が必要です。研究結果は、この違いを認識し、専門的な教材で対応することの重要性を実証的に示しています。
政策立案への含意
この研究は、州や学区レベルでの政策立案に重要な示唆を提供しています。研究者は、州がELD教材の購入と使用を義務づけ、そのための費用支援を行うことを提案しています。テキサス州では英語言語開発教材の購入は義務ではありませんが、研究結果はこの政策の見直しの必要性を示唆しています。
また、教材の効果に関するより多くの研究情報があれば、学区指導者はより良い選択ができる可能性があります。現在、多くの学区指導者は教材の効果に関する客観的情報を持たず、教師の受け入れやすさや近隣学区のアドバイスに基づいて決定を行っています。
研究結果の解釈における注意点
因果関係の推定精度
この研究では準実験デザインを用いていますが、真のランダム化比較試験と比較すると、因果関係の推定には一定の不確実性が残ります。特に、学区や学校レベルでの選択には、研究者が把握できない要因が影響している可能性があります。
ただし、研究者は可能な限りの統計的検証を行っており、複数の分析手法で一貫した結果を得ていることから、結果の信頼性は比較的高いと考えられます。また、偽造テストの結果も、観察された効果が本当に教材によるものである可能性を支持しています。
効果の持続性について
この研究では、教材導入から約4年後の時点での効果を測定していますが、より長期的な効果については不明です。英語習得は長期にわたるプロセスであり、教材の効果がどの程度持続するかは別途検証する必要があります。
また、研究では小学校段階の効果のみを検証しており、中学校や高校段階での効果は不明です。英語学習者の教育支援を考える際には、より包括的な視点が必要になります。
より広い文脈での意義
アメリカの教育格差問題との関連
この研究は、アメリカの教育システムが抱える構造的な格差問題を浮き彫りにしています。英語学習者の多くは低所得家庭出身のヒスパニック系生徒であり、すでに複数の不利な条件を抱えています。そのような生徒に対して、適切な教材支援すら提供されていない現状は、教育機会の平等という観点から深刻な問題です。
研究結果は、比較的導入コストの低い教材改善によって、これらの生徒の学習成果を改善できる可能性を示しています。これは、大規模な制度改革を伴わない現実的な改善策として、政策立案者の注目を集める可能性があります。
国際的な示唆
アメリカ国内の研究でありながら、この成果は国際的にも重要な意味を持ちます。移民や難民の増加により、多くの先進国で第二言語学習者への教育支援が課題となっています。専門的な教材の効果を実証的に示したこの研究は、他国の政策立案にも参考になる可能性があります。
今後の研究課題
実装プロセスの解明
この研究の重要な限界の一つは、教材の実装プロセスを詳細に分析していないことです。同じ教材を購入していても、教師の使用方法、管理職の支援体制、学校全体の取り組み姿勢などによって効果は大きく変わる可能性があります。
今後は、効果的な実装のための条件を明らかにする研究が重要になります。どのような研修が必要か、どの程度の実装度で効果が現れるのか、実装を妨げる要因は何かといった問題を解明することで、政策の実効性を高められる可能性があります。
長期追跡調査の必要性
英語習得は長期にわたるプロセスであり、教材の効果も長期的な視点で評価する必要があります。小学校段階での効果が中学校、高校、さらには大学進学や就職にまで影響するかは、別途検証すべき重要な問題です。
また、英語習得だけでなく、学習者のアイデンティティ形成、母語の維持、文化的適応などの側面も含めた包括的な評価が求められます。
結論:教材研究の意義と課題
この研究は、英語学習者向け教材の効果を実証的に示した重要な成果です。特に、「何らかの専門教材を使用することの重要性」を統計的に明らかにした点は、教育政策や現場の実践に大きな示唆を与えています。
一方で、準実験デザインの限界、サンプルの代表性の問題、実装プロセスの未解明など、課題も残されています。これらの限界を踏まえつつも、この研究は英語学習者教育の改善に向けた重要な一歩として評価されるべきです。
教育における格差の解消は容易な課題ではありませんが、この研究は比較的実現可能な改善策の存在を示しました。政策立案者、教育管理者、現場教師が連携して、すべての英語学習者に適切な教材支援を提供することで、より公正な教育システムの実現に近づける可能性があります。
今後、この種の実証研究がより多くの州や国で行われ、英語学習者教育の質向上につながることが期待されます。同時に、教材だけでなく、教師研修、評価システム、学習環境など、総合的な支援体制の構築も進められるべきでしょう。教材は重要な要素の一つですが、それだけで問題が解決するわけではないということも、忘れてはならない点です。
Lê, Q. T. N., & Polikoff, M. S. (2021). Do English Language Development curriculum materials matter for students’ English proficiency? SAGE Open, 11(3), 1-15. https://doi.org/10.1177/21582440211035770