はじめに―常識を問い直す大規模研究

英語を母語として育った人と、後から学んだ人では、読む力にどれくらいの違いがあるのでしょうか。多くの人は「当然、母語話者の方が優れているはず」と考えるかもしれません。しかし、The Hebrew University of JerusalemのNoam Siegelmanらが率いる国際研究チームが発表した大規模調査は、この常識に一石を投じる結果を示しています。 この研究”Rethinking first language–second language similarities and differences in English proficiency: Insights from the ENglish Reading Online (ENRO) project”は、19カ国、30の大学・研究機関から7,338人もの大学生を集めて実施されました。これほど多様な言語背景を持つ人々を対象にした英語読解研究は前例がありません。参加者の母語は、中国語、日本語、モンゴル語、タイ語、ヒンディー語から、アラビア語、ヘブライ語、ロシア語、セルビア語、スロベニア語、さらにフランス語、イタリア語、スペイン語、オランダ語、ドイツ語まで、実に16言語に及びます。

研究の背景―なぜ大規模データが必要だったのか

この壮大なプロジェクトの背景には、第二言語研究が抱えてきた根本的な問題がありました。従来の研究は、異なる測定方法、異なる参加者基準、異なる言語背景を扱った個別の小規模研究の寄せ集めでした。これでは、本当に一般化できる知見を得ることが難しかったのです。 例えば、Melby-LervågとLervågが2014年に行った包括的レビューでは、82の研究を集めても、対象となった第二言語はわずか11種類、母語背景は21種類に過ぎませんでした。これは、カナダのMcMaster大学(学生数3万人規模)における学生の言語背景の多様性の3分の1程度、大学で教えられている第二言語の半分程度しかカバーしていないことになります。 さらに問題だったのは、研究の焦点が「違い」に偏っていたことです。科学的仮説検証の伝統では、「違いがある」ことを証明することが重視されます。しかし、母語話者と第二言語学習者の間に「違いがない」ことを示すには、膨大なサンプル数が必要です。統計的に小さな効果の不在を検証するには、最低でも860人の参加者が必要で、交互作用効果の不在を示すにはその4倍必要だとされています。 このような実用的制約から、多くの研究は母語話者と学習者の「違い」を強調する傾向にありました。しかし、両者が共有する特徴を見落としていたら、どうなるでしょうか。理論的にも実践的にも、重要な見落としになるかもしれません。

何を測定したのか―包括的なテストバッテリー

研究チームは、参加者全員に同じテストを受けてもらいました。すべてオンラインで実施できるように設計されており、特殊な機器は不要です。これにより、世界中の多様な研究サイトからデータを集めることが可能になりました。 中核となるのは読解テストです。15の英文テキストを読んでもらい、それぞれに3つの選択式の理解度チェック問題が用意されました。

テキストは百科事典のような説明文で、Samuel Morseのような人物や、Da Vinciの発明といった歴史的・自然現象について書かれています。理解度の正答率だけでなく、読む速度(1分間に何語読めるか)も測定しました。 リスニング理解力も測定されました。5つの音声パッセージを聞いて、それぞれ5つの質問に答えます。これらの音声は、Rutgers大学のオーラルヒストリーアーカイブから選ばれた実際の語りで、プロの俳優が北米アクセントで録音したものです。 さらに、英語の「構成要素スキル」として、7つのテストが実施されました。語彙力、スペリング、文法知識、単語認識(lexical decision)、綴り字の認識、文の区切り方の理解、そしてLexTALEという上級学習者向けの語彙テストです。これらは、先行研究で読解力と強く関連することが示されているスキルです。 加えて、詳細な言語背景アンケートも実施されました。何歳で英語を学び始めたか、日常生活でどの言語をどれくらい使っているか、自己評価による英語の話す力・読む力はどうかなど、豊富な情報が収集されています。 すべてのテストを完了するのに、参加者は約1.5時間を要しました。これだけの時間をかけた包括的なデータ収集は、オンライン実施だからこそ可能になったのです。

第一言語と第二言語の定義―5歳という基準

この研究では、5歳より前に英語を話し始めた人を「第一言語(L1)話者」、5歳以降に学び始めた人を「第二言語(L2)学習者」と定義しました。5歳という基準は、多くの国で正式な学校教育が始まる年齢に対応しています。 この定義には議論の余地があります。例えば、1歳から英語に触れていた子どもを第二言語学習者と分類する研究者もいます。しかし、Siegelmanらは、実用的な基準として5歳を採用しました。重要なのは、全データとコードが公開されているため、他の研究者が異なる定義で再分析できることです。 結果として、L1話者が3,853人、L2学習者が3,485人となりました。L2学習者の多くは、大学入学のための英語試験に合格した上級レベルの学習者です。英語が主要言語でない国の大学では、過度に集中的な英語経験を持つ学生(英語圏で6ヶ月以上暮らした人など)は除外されました。これは、典型的な大学生の英語力を反映させるためです。

驚くべき発見―理解度に差はなし

最も注目すべき発見は、読解理解度とリスニング理解度において、L1話者とL2学習者の間にほとんど差がなかったことです。読解理解度の平均正答率は、両グループともに73%でした。統計的な効果量(Cohen’s d)はなんと0.00、つまり差がないということです。リスニング理解度も、L1が64%、L2が60%で、効果量は0.22という小さな値でした。 これは、従来の想定とは大きく異なります。多くの人は「母語話者の方が当然よく理解できるはず」と考えるでしょう。しかし、少なくとも大学レベルの上級学習者においては、理解の質という点では、ほぼ同等のレベルに達しているのです。 一方で、読む速度には明確な違いがありました。L1話者は平均で1分間に267語読めるのに対し、L2学習者は199語でした。効果量は0.68で、これは中程度から大きな差とされる値です。つまり、理解度は同じでも、その理解に到達する速さが異なるということです。 この発見は、読解力を「理解の質」と「処理の速さ(流暢性)」という2つの異なる側面として捉える必要性を示唆しています。従来の研究では、これらが混同されがちでした。

個別スキルの影響―文法と語彙が鍵

では、どの英語スキルが最も理解度を予測するのでしょうか。相関分析の結果、読解理解度と最も強く相関していたのは、順に次のようなスキルでした。 まず、リスニング理解度です(相関係数r = 0.69, L1話者の場合)。これは、書かれた言葉を読む力と、聞いた言葉を理解する力が強く結びついていることを示しています。次に語彙力(r = 0.59)、文法知識(r = 0.49)、スペリング力(r = 0.48)、単語認識の正確さ(r = 0.61)などが続きます。 興味深いことに、この順序はL2学習者でもほぼ同じでした。つまり、英語の読解力を支える基本的な構造は、母語話者でも学習者でも共通しているのです。 これらの結果は、過去の大規模メタ分析(Jeon and Yamashita 2014, 2022; In’nami et al. 2022)の結果とも一致していました。メタ分析では、多数の異なる研究を統合して傾向を見出しますが、ENROプロジェクトは単一の一貫した方法で同じパターンを確認したことになります。これは、ENROデータの妥当性を裏付ける重要な証拠です。

分散分析が明かす真実―L1/L2の違いは小さかった

研究チームは、読解理解度、リスニング理解度、読書速度のばらつきを4つのステップで分析しました。まず個々の英語スキルがどれだけ説明するか、次にL1/L2の区別がどれだけ追加で説明するか、さらに具体的な母語の違い(中国語、日本語、ロシア語など)がどう影響するか、最後に同じ国内でも大学による違いがあるかを調べました。 結果は明快でした。読解理解度の分散の50.1%は英語スキルで説明され、L1/L2の区別が追加で説明したのはわずか2.1%でした。リスニング理解度も同様で、英語スキルが40.9%を説明し、L1/L2の区別は2.1%でした。 つまり、読解やリスニングの理解度を予測する上で、その人が母語話者か学習者かという情報は、ほとんど役に立たないということです。重要なのは、その人が実際にどれだけの語彙を知っているか、文法をどれだけ理解しているかといった、具体的なスキルレベルなのです。 興味深いことに、読書速度では異なるパターンが見られました。英語スキルが説明したのは16.7%に過ぎず、L1/L2の区別は3.2%を説明しました。相対的に見ると、速度においてはL1/L2の違いがより重要だということです。また、具体的な母語の違い(3.6%)や大学間の違い(3.1%)も、理解度の場合より大きな役割を果たしていました。 これらの結果は、理解の「質」と「速さ」が異なる性質を持つことを示しています。質は主に個人の英語スキルで決まりますが、速さはそれ以外の要因(認知処理速度など)にも影響されるようです。

相関パターンの類似性―L1とL2は同じ構造

研究チームは、すべてのテスト間の相関関係を、L1グループとL2グループで別々に計算しました。136通りの相関ペアすべてを比較したところ、統計的に有意な差が見られたのは32%でした。しかし、そのほとんどは自己申告による情報(英語の習得開始年齢、自己評価の英語力など)に関するものでした。 実際のスキルテスト同士の相関で、L1とL2の間に大きな違いがあったのは、わずかでした。例えば、文法知識とリスニング理解度の相関は、L1では0.40、L2では0.61と、L2の方がやや高めでしたが、これも例外的なケースです。 つまり、英語の様々なスキルがどう関連し合っているかという基本構造は、母語話者でも学習者でもほぼ同じだということです。語彙が豊富な人は文法も強く、文法が強い人は読解も上手い、といった関係性は、L1でもL2でも共通しているのです。 因子分析という統計手法を用いた分析でも、同様の結果が得られました。L1とL2の両方で、3つの主要な因子が抽出されました。第1因子は、語彙、文法、スペリングなど「時間制限のない英語スキル」を表していました。第2因子は、単語認識や語彙判断の反応時間など「処理の速さ」を反映していました。第3因子は読解とリスニングの理解度で、興味深いことに読書速度も(負の相関で)含まれていました。速く読む人ほど理解度が低い傾向があるという、いわゆるスピード・正確さのトレードオフです。 L1とL2で微妙な違いもありました。例えば、L2では理解度と読書速度が第1因子にも関連していましたが、L1ではそうではありませんでした。これは、L2学習者にとっては、理解度と速度が基本的な英語力により密接に結びついていることを示唆します。しかし全体として、類似点の方がはるかに顕著でした。

実践的な含意―教育と評価への示唆

これらの発見は、英語教育と評価に重要な示唆を与えます。 まず、上級レベルの第二言語学習者は、理解の質という点では母語話者と遜色ないレベルに達することができる、という希望を与えてくれます。大学入学を目指す学習者や、職場で英語を使う必要がある人々にとって、これは励みになるでしょう。 一方で、読む速さは別の問題です。たとえ理解度が同じでも、L2学習者はL1話者の約4分の3の速度でしか読めません。学術的な環境や職場では、時間制限のある試験や締め切りのある業務が一般的です。時間的プレッシャーの下では、この速度の違いが不利に働く可能性があります。 したがって、教育プログラムは理解度だけでなく、読書速度の向上にも焦点を当てるべきかもしれません。従来、速読訓練はあまり重視されてきませんでしたが、この研究は速度の重要性を浮き彫りにしています。 評価の面では、L1/L2という二分法で学習者を分類することの限界が示されました。個々の学習者の具体的なスキルプロフィール(語彙はどうか、文法はどうか、など)を見ることの方が、はるかに有用だということです。

研究の限界―今後への課題

Siegelmanらは、自身の研究の限界についても率直に述べています。 まず、対象者が大学生という、比較的高学歴で若い層に限られています。また、L2学習者は「上級レベル」の人々です。初級や中級の学習者、あるいは学齢期の子どもたちでは、異なるパターンが見られるかもしれません。 L1/L2の定義(5歳という基準)にも議論の余地があります。1歳から英語に触れていた子どもと、5歳から学び始めた子どもを同じ「L2」として扱うことには、異論があるでしょう。ただし、全データが公開されているため、研究者は異なる基準で再分析することができます。 テストの内容も限定的です。読解テストは説明文のみで、小説などの文学作品は含まれていません。また、理解度の測定は多肢選択式の質問に基づいており、自由記述による再生テストなどは行われていません。研究によれば、再生テストの方がL1/L2の差が大きく出る可能性があります。 重要なスキルのいくつかが測定されていません。例えば、音韻認識(音の操作能力)や形態認識(語の構成要素の理解)、作業記憶などの一般的認知能力は含まれていません。L2学習者の母語での読解力も測定されていません。これは、16もの異なる言語で同等のテストを用意することの実用的困難さゆえです。 最後に、対象言語が英語のみであることです。英語は世界で最も研究されている言語ですが、それゆえに過剰に研究されているとも言えます。他の言語を対象とした同様の大規模研究が必要でしょう。

今後の研究の可能性―豊富なデータの活用

とはいえ、ENROデータベースには、まだまだ掘り下げる余地があります。研究チームは、いくつかの可能性を示唆しています。 まず、言語使用の生態学的な側面です。詳細なアンケートには、各言語をどの場面でどれくらい使うか(家庭、学校、職場、友人との会話など)という情報が含まれています。これを分析することで、日常的な言語使用パターンが英語力にどう影響するかを調べることができます。 また、試行レベル(trial-level)のデータも公開されています。例えば、単語認識テストでは、どの単語にどれくらいの時間がかかったか、正誤はどうだったか、といった詳細なデータがあります。これを使えば、語の頻度や長さなどの特性が、L1話者と学習者でどう異なる影響を与えるかを精密に調べられます。 言語間の距離の影響も興味深いテーマです。中国語話者にとっての英語学習と、ドイツ語話者にとっての英語学習では、言語の類似性が異なります。また、文字体系(アルファベット対非アルファベット)の違いも影響するかもしれません。ENROの多様な言語背景は、こうした問いに答える理想的なデータです。 クラウドソーシングと大学サンプルの比較も可能です。2つのサンプルはオンラインプラットフォームで募集されましたが、残りは大学で募集されました。両者の質を比較することで、オンライン研究の妥当性を検証できます。

理論的貢献―連続体としての言語能力

この研究の最大の理論的貢献は、L1/L2という二分法への挑戦です。従来、母語話者と学習者は質的に異なる存在として扱われがちでした。しかしENROのデータは、少なくとも上級レベルでは、両者の違いより類似点の方が大きいことを示しています。 英語能力は、「母語話者」と「学習者」という離散的カテゴリーではなく、スキル、能力、経験の連続体として捉える方が適切かもしれません。ある人がどこに位置するかは、L1/L2という二値変数よりも、具体的なスキルの組み合わせによって決まるのです。 この視点は、DiependaeleらやGulliferらの先行研究とも一致します。彼らは、語の頻度効果などの現象が、L1/L2の違いではなく語彙サイズの違いで説明できることを示しました。つまり、表面的な「L1/L2の違い」は、実は背後にある個別スキルの違いの反映に過ぎないのです。 もちろん、これは初級学習者や子どもにも当てはまるわけではありません。また、すべての言語現象で同じとは限りません。しかし、大学レベルの読解研究に関しては、L1/L2の枠組みを超えた個人差アプローチが有用だということです。

オープンサイエンスの実践―データの公開

ENRO プロジェクトのもう一つの重要な側面は、完全なデータ公開へのコミットメントです。すべての参加者データ、試行レベルデータ、分析コードがOpen Science Frameworkで公開されています(https://osf.io/gzyqf)。 これにより、他の研究者は様々なことができます。異なる統計手法で再分析したり、L1/L2の定義を変えて結果がどう変わるか確認したり、特定の言語背景だけに焦点を当てたり、本論文では触れられなかった変数を探索したりできます。 また、データの一部(12のテキスト)は、先行研究のMECO(Multilingual Eye-Movements Corpus)と共通しています。これにより、眼球運動データを持つMECOと、より広範なサンプルを持つENROを組み合わせた分析も可能です。 このようなオープンサイエンスの実践は、研究の透明性と再現性を高めます。さらに、巨額の資金を投じた大規模データ収集の価値を最大化することにもつながります。一つのチームが考えつく分析には限界がありますが、世界中の研究者が同じデータを様々な角度から分析することで、新しい発見が生まれる可能性が広がります。

結論―固定観念を超えて

この研究は、母語話者と第二言語学習者についての私たちの「常識」に再考を促します。上級レベルの学習者は、理解の質において母語話者と同等のレベルに達することができます。両者の英語力を支える基本構造は驚くほど似ています。個々のスキルが重要であり、L1/L2というラベルはそれほど意味を持ちません。 ただし、読む速さという点では明確な違いが残ります。これは教育や職場での支援を考える上で重要です。また、この発見は「速度」と「正確さ」が別の次元であることも示唆しており、今後の読解研究の方向性に影響を与えるでしょう。 7,000人を超える参加者、19カ国、16の母語背景という前例のない規模で、Siegelmanらのチームは言語研究に貴重な資源を提供しました。この研究は、大規模データの力、国際協力の重要性、そしてオープンサイエンスの可能性を示す好例です。 今後、このデータから さらに多くの発見が生まれることが期待されます。言語習得の本質、読解プロセスの普遍性と多様性、効果的な教育方法など、様々な問いに光を当てることができるでしょう。そして何より、母語話者と学習者を固定的なカテゴリーとして扱うのではなく、一人ひとりの具体的なスキルと経験に目を向けることの大切さを、この研究は教えてくれています。


Siegelman, N., Elgort, I., Brysbaert, M., Agrawal, N., Amenta, S., Arsenijević Mijalković, J., Chang, C. S., Chernova, D., Chetail, F., Clarke, A. J. B., Content, A., Crepaldi, D., Davaabold, N., Delgersuren, S., Deutsch, A., Dibrova, V., Drieghe, D., Filipović Đurđević, D., Finch, B., . . . Kuperman, V. (2024). Rethinking first language–second language similarities and differences in English proficiency: Insights from the ENglish Reading Online (ENRO) project. Language Learning, 74(1), 249–294. https://doi.org/10.1111/lang.12586

By 吉成 雄一郎

株式会社リンガポルタ代表取締役社長。東京電機大学教授、東海大学教授を経て現職。コロンビア大学大学院ティーチャーズカレッジ(英語教授法)、信州大学大学院工学研究科(情報工学)修了。専門は英語教授法、英語教育システム開発。 さまざまな英語学習書、英検、TOEIC 対策書、マルチメディア教材等を手がけてきた。英語e ラーニングや英語関係の教材・コンテンツの研究開発も行う。全国の大学、短期大学、高専等で使われているe ラーニングシステム「リンガポルタ」も開発した。最近ではAI による新しい教育システムの開発にも着手している。

Amazon プライム対象