英語の授業を担当したことのある人なら、こんな経験があるのではないでしょうか。丁寧に文法規則を説明したとき、みるみる理解する学生がいる一方で、いくら説明しても腑に落ちない様子の学生がいる。逆に、規則は一切教えず大量のインプットを与えたとき、自分でパターンを見抜いてしまう学生がいれば、どこから手をつければいいかわからず途方に暮れる学生もいる。この「指導法と学習者のかみ合い」の問題は、日本の英語教育現場でも長年の悩みですが、それを実証的に解き明かしてきた研究の蓄積は、案外と少ないのです。
2024年にThe Modern Language Journalに掲載されたRoehr-Brackinら4名による論文”The role of individual learner differences in explicit language instruction”は、まさにその問いに正面から向き合った力作です。Essex大学のKaren Roehr-BrackinとRenato Pavlekovic、Adam Mickiewicz大学のKarolina BaranowskaとPaweł Schefflerという英国・ポーランドの研究者チームが組み、適性と指導法の「組み合わせ」が学習結果をどう左右するかを、かつてないほど精緻な方法で検証しています。以下では、この論文の内容を丁寧に紹介しながら、日本の英語教育への含意を考えてみたいと思います。
「誰にでも効く教え方」は存在するのか
第二言語習得研究において「適性―処遇交互作用(aptitude-treatment interaction、以下ATI)」と呼ばれる研究領域があります。「aptitude(適性)」とは、いわば言語を学ぶための認知的な素質のことで、音の識別・記憶能力(音声コーディング能力)、文法パターンを見抜く能力(言語分析能力)、連想記憶、そして作動記憶(ワーキングメモリ)などが含まれます。「treatment(処遇)」とは、どんな指導法を使うかということです。ATI研究は、「どの指導法が一番よいか」という問いではなく、「どの学習者にどの指導法が合うか」という問いを立てる点が特徴的です。
つまり、「演繹的文法指導(規則を先に教える)がよいか、帰納的指導(自分でパターンを発見させる)がよいか」という二択で考えるのではなく、「記憶力に優れた学習者には帰納的指導が向いているかもしれないが、分析能力が低い学習者には演繹的指導の方が有効かもしれない」というように、学習者の特性と指導法の組み合わせを見るわけです。
日本の英語教育では「コミュニカティブ・アプローチがよい」「やはり文法指導が大事だ」といった議論が繰り返されてきました。しかし、そもそも学習者によって「向いている指導法」が異なるとすれば、どちらが正しいかという問いそのものが的外れかもしれません。この論文が示すのは、まさにそういう視点の転換です。
136名の国際的ボランティアをポーランド語で実験
研究のデザインはかなり野心的です。研究チームはオンラインのポーランド語入門講座を開発し、ポーランド語もスラブ系言語も全く知らない136名の国際的なボランティア(中国語、日本語、トルコ語等を母語とする成人)を対象に実験を行いました。参加者の大半は18歳から30歳前後の学生で、平均年齢は約23歳です。
ポーランド語を選んだのは巧みな判断といえます。英語母語話者にとっても非母語話者にとっても「完全な初学者」として扱えるため、既存の知識が結果に影響するリスクを最小限に抑えられます。日本語母語話者の場合、英語の実験では「すでに一定の知識がある」ことが交絡変数になりがちですが、ポーランド語ならその心配がありません。
学習内容は形容詞―名詞の性一致(czerwona walizka「赤いスーツケース」のような表現)と否定文における属格形(例えば「スーツケースを買った」が「スーツケースを買わなかった」になると語尾が変わる)の2つの文法項目です。前者は3種類の語尾変化、後者は6種類を含むため、後者の方が難しいと予測されました。
指導条件は4つ用意されました。聴覚提示・帰納的指導、文字提示・帰納的指導、混合提示・帰納的指導、混合提示・演繹的指導です。帰納的指導では文法規則の説明は与えず、学習者が自分でパターンを見つけることを促します。演繹的指導では英語で文法規則を先に示します。「インプットの様式(音声か文字か、あるいは両方か)」という変数を組み込んだことが、本研究の独自性の一つです。
適性の測定にはLLAMAテスト(連想記憶・音声記号対応・音声認識・言語分析の4つのサブテスト)と、作動記憶を測るO-Spanタスク、そして潜在的学習能力を測るSRT(系列反応時間)課題を使っています。さらに、背景質問紙で多言語使用度(何言語をどの程度のレベルで知っているか)、年齢、教育歴、指導材料に対する感想なども収集しています。
「覚える型」と「分析する型」の学習者は実在する
結果の中で特に印象深いのは、クラスター分析による「学習者プロファイル」の発見です。研究チームはLLAMAの各サブテスト、O-Span、多言語度などを変数として投入し、参加者を4グループに分類しました。
第1クラスター(33名)は全体的に適性が低く、多言語経験も乏しいグループ。第4クラスター(15名)は逆に適性全般が高く、多言語経験も豊富な「高適性」グループです。興味深いのは中間の2グループで、第2クラスター(31名)はとくに連想記憶とO-Spanが高い「記憶志向型」、第3クラスター(35名)は言語分析能力(LLAMA F)が高い「分析志向型」でした。
この4分類は、1980年代にSkehanやWesche(1981)が提唱し、Ranta(2002)が実証的に確認した「記憶志向型」と「分析志向型」という古典的な分類と一致しています。Roehr-BrackinらはRantaの研究を詳しく引用していますが、Ranta(2002)はカナダの青年を対象にL1の金属言語タスクと複数のL2指標から同様の4分類を導いた研究者です。今回の研究は成人・国際的サンプル・オンライン環境・LLAMA使用という全く異なる条件にもかかわらず、同じ4グループが出現したことを「学習者タイプの心理的実在性の強力な証拠」と位置づけています。
これは実はかなり強い主張です。異なる方法論・異なる集団で同じ構造が繰り返し現れるということは、この分類が「研究設定の人工物」ではなく、人間の言語学習能力の基底にある何かを反映している可能性を示唆するからです。日本の教育現場で「クラスの中の多様性」として経験的に感じてきたことが、認知科学的な裏付けを得つつあると言えるでしょう。
演繹的指導は個人差を「均す」、帰納的指導は個人差を「引き出す」
ATI分析の結果は明確で、かつ実践的に重要な示唆を持っています。
まず、混合提示・演繹的指導グループでは、いかなる認知的適性指標も事後テスト成績と有意な相関を示しませんでした。つまり、「規則を先に説明してから練習させる」方式では、記憶が得意でも分析が得意でも、あるいは苦手でも、成績に差が出にくいということです。Erlam(2005)がフランス語学習者で同様のパターンを報告して以来、複数の研究が「演繹的指導の均等化効果」を支持してきましたが(Hwu & Sun, 2012; Li et al., 2019; Sanz et al., 2016)、本研究もこれを再確認しました。ただし、演繹的グループは4条件の中でテスト成績が最も低かった点には注意が必要です。均等化されたとはいえ、全員が低い水準に均等化されたわけで、これを「全員に公平な指導法」と手放しで賞賛するのは早計でしょう。
一方、単一モダリティの帰納的指導(聴覚のみ、または文字のみ)では、プロファイル間の差が顕在化しました。聴覚提示・帰納的グループでは、高適性グループが低適性グループを有意に上回りました。高適性グループは音声コーディング能力(LLAMA D・E)が高く、耳から入ってくる音の微細な変化を捉えてパターンを発見できた、という解釈が成り立ちます。文字提示・帰納的グループでは、高適性グループだけでなく、分析志向型と記憶志向型の両グループも低適性グループを上回りました。文字情報は持続的で何度でも見返せるため、分析能力あるいは記憶力がある学習者はそれぞれ得意な方略で活用できた、と解釈されています。
逆に言えば、低適性グループにとっては、聴覚のみでも文字のみでも(そして演繹的指導でも)、いずれの条件も十分なサポートを提供できていない可能性があります。研究者たちは「学習者の個人差を最も有効に均等化するには、演繹的指導と混合モダリティ提示の組み合わせが必要かもしれない」という仮説を提示しています。これは教育実践への直接的な問いかけです。
なぜ「多言語経験」が認知的適性と並ぶ予測変数になるのか
もう一つ見逃せない発見が、多言語経験(multilingualism score)の役割です。重回帰分析では、事後テストを予測する変数として、音声・言語分析的適性(最も強い予測力)、多言語度、年齢の3つが一貫して有意でした。
多言語経験が言語学習能力を高めるという主張は直感的には理解しやすいですが、本研究では多言語度が認知的適性とは独立した別の予測変数として機能している点が重要です。つまり、「これまでに複数の言語を学んできた経験の蓄積」は、生まれ持った認知能力とは別に、それ自体が新たな言語を学ぶ際の資産(論文の言葉を借りれば「capital」)となっているということです。
この知見は日本の英語教育にも直接関係します。中学・高校・大学と英語を学んできた学習者が、たとえテストの点数が低くても、その経験自体が次の言語習得(例えば第3言語としての中国語や韓国語)を有利にする可能性があります。また、小学校での英語必修化や外国語活動の意義を、「英語力の直接的向上」だけでなく「多言語的経験値の蓄積」という観点から捉え直すことができるかもしれません。
クラスター分析の結果でも、第4クラスター(高適性グループ)は多言語度も最も高く、両者が互いを強化し合う関係にある様子が窺えます。一方で、多言語度が高い集団で適性も上がる傾向は、「語学が得意な人が多くの言語を学ぶ」という逆因果の可能性も排除できません。この点の解明には縦断的研究が必要で、著者たちも今後の課題として認識しています。
インプットの様式という、見落とされてきた変数
本研究の中で最も「穴を埋めた」と言えるのが、インプットの様式(音声か文字か)という変数の導入です。著者たちも認めているように、ATI研究においてこの変数を体系的に検討した先行研究は皆無に近い状態でした。Robinson(2001, 2007)の「適性複合体」理論では音声インプットと文字インプットを理論的に区別しているにもかかわらず、実証研究での対応が遅れていたのです。
本研究の結果が示したのは、同じ帰納的指導でも音声中心か文字中心かによって「どの学習者が恩恵を受けるか」が変わるということです。音声では音声コーディング能力が鍵を握り、文字では言語分析能力と記憶力が鍵を握る。これは当たり前のように聞こえますが、言語指導の設計上は重大な含意を持ちます。
日本の英語教育の文脈では、リスニング重視の指導とリーディング・文法重視の指導の間で長年の揺り戻しが続いてきました。「読む・書く」中心の伝統的英語教育への批判から「聞く・話す」重視の改革が推進されてきた経緯があります。しかし本研究の知見に照らせば、問題は「どちらが優れているか」ではなく「どの学習者にどちらが合うか、そしてどう組み合わせるか」になります。音声コーディング能力が弱い学習者には、音声のみのインプットは非常にハードルが高い。文字情報との組み合わせが特に有効である可能性があります。
研究の強みと限界を公平に見る
この論文の強みは、まず生態学的妥当性(ecological validity)の高い実験設計にあります。実際の語学コースで使われるような対話・練習・フィードバックを含むオンライン教材を開発し、現実の学習環境に近い条件で実験を行っています。また適性の測定も、音声コーディング・言語分析・連想記憶・潜在学習・作動記憶という幅広い構成要素をカバーしており、従来のATI研究が作動記憶や言語分析能力の1〜2変数に絞っていたのとは対照的です。クラスター分析の採用も、個別変数の主効果を検討するだけでなく、学習者を「タイプ」として理解しようとする点で評価できます。
一方で限界も率直に認識しておく必要があります。第一に、サンプルサイズが必ずしも十分でない点です。4条件×4クラスターの組み合わせでは、各セルの人数が一桁になる場合もあり、統計的検出力が低くなります。著者たち自身が認めているように、混合帰納的条件における高適性グループの機能については、人数が少なすぎて有意な結論を出せませんでした。
第二に、事後テストのみで遅延テストがない点です。直後の記憶は測れても、学習が「定着」したかどうかは別問題です。言語習得研究において、即時テストと遅延テストで異なるパターンが現れることは珍しくなく(例えばSanz et al., 2016)、本研究の知見がどの程度持続的な学習を反映しているかは不明です。
第三に、参加者の大半が中国語を母語とする学生(91名)であり、日本語母語話者(15名)、トルコ語母語話者(6名)と比較すると偏りがあります。母語の特性が言語分析能力や音声コーディング能力の測定値に影響を及ぼす可能性は否定できず、結果の一般化には慎重さが求められます。
第四に、潜在学習能力の指標として用いたSRT課題が、言語的な事後テストとの相関をほとんど示さなかった点も議論を呼びそうです。著者たちはこれを「潜在的適性は初級段階では機能しない」という理論(Li, 2022)と「視覚的・非言語的刺激によるSRT課題と言語学習の乖離」という2つの観点から解釈しています。しかしこの点は、潜在的適性の測定法そのものの妥当性問題(Perruchet, 2021)とも絡んでおり、単純な結論は出しにくいところです。
日本の英語教育現場への具体的示唆
それでは、日本の英語教育の文脈で本研究からどのような示唆を引き出せるでしょうか。
まず、「演繹的文法指導の均等化効果」は日本の教育現場に再評価の機会を与えます。文法を先に説明するいわゆる「PPP(提示・練習・産出)」型の指導は、コミュニカティブ・アプローチの普及とともに「古い」「効果が低い」と見なされがちです。しかし本研究は、演繹的指導が学習者間の認知的能力の差を中和する働きを持つことを示しています。クラス全体の底上げを図り、誰も取り残さないというミッションを持つ教師にとって、文法説明の持つ「平等化」機能は見直す価値があります。ただし、それは「低いレベルへの均等化」でもあることを忘れてはなりません。
次に、「音声のみのインプット」の難しさを認識することも重要です。日本の英語授業で「英語で授業を行う」ことが推奨されてきた背景には、音声インプットの量を増やすという意図があります。しかし本研究は、音声のみのインプット環境では音声コーディング能力が高い学習者だけが有利になることを示唆しています。文字サポートを組み合わせることで、より多様な学習者が恩恵を受けられる可能性があります。英語の歌や動画だけでなく、字幕や文字化したテキストを同時に活用することの理論的根拠がここにあります。
さらに、「多言語経験の蓄積」という観点は、英語に加えて第3言語教育を考える際の基盤となります。近年、一部の大学や高校では英語に加えて中国語・韓国語・スペイン語等の学習機会を提供する動きがあります。本研究の知見は、第2言語の経験それ自体が認知的適性とは独立して第3言語習得を助けることを示唆しており、複数言語学習の推進を支持する実証的根拠の一つになりえます。
そして、オンライン英語学習ツールが普及した現在、適応型学習(adaptive learning)の設計に本研究の知見を活かせる可能性があります。学習者の音声認識能力・言語分析能力・記憶力などを測定した上で、最適なインプット様式と指導法を提供するシステムは、技術的には今日の範囲内にあります。著者たちも結論部で「今日のオンライン語学学習ツールの文脈では、ATI研究から生まれる提言はかつてよりもずっと実現可能だ」と述べており、研究知見の実装可能性を強調しています。
この研究が残した「問い」
最後に、本研究が解決しなかった問い、あるいは新たに浮かび上がらせた問いにも触れておきたいと思います。
著者たちは混合モダリティ・演繹的指導の組み合わせが「最も平等化効果を持つかもしれない」と仮説的に述べていますが、それを直接検証する条件は今回の実験には含まれていません。音声のみ帰納的、文字のみ帰納的、混合帰納的、混合演繹的という4条件の中に「音声のみ演繹的」や「文字のみ演繹的」が含まれていれば、モダリティと指導タイプのより細かい交互作用が見えたはずです。次の研究が待たれるところです。
また、学習者の「好み(perceptions)」の役割も気になります。本研究では学習者の指導材料に対する感想がPosttest 1の弱い予測変数として現れましたが、Posttest 2では有意ではなくなりました。情意的・態度的変数は認知的変数ほど強力な予測力を持たないことが多いですが、学習者が自分の指導法に不満を感じていれば認知的能力があっても力を発揮できない、という状況も十分ありえます。この側面は、今後のATI研究でより体系的に組み込まれる必要があるでしょう。
Roehr-Brackinらのこの論文は、「学習者は個人差を持つ」という当たり前のことを改めて実証し、「だからこそ指導法の選択が重要だ」というメッセージを丁寧に届けてくれる研究です。教室の中の「みんな違う」という現実を、困惑ではなく設計の出発点として受け止めるとき、日本の英語教育はまた一歩、豊かな方向に踏み出せるのではないでしょうか。
Roehr-Brackin, K., Baranowska, K., Pavlekovic, R., & Scheffler, P. (2024). The role of individual learner differences in explicit language instruction. The Modern Language Journal, 108(4), 815–845. https://doi.org/10.1111/modl.12963
