研究の背景と重要性
この論文”Dynamic tests as a language-free method for assessing reading in a multilingual setting”は、レディング大学のRachel E. Pye博士とレディング大学マレーシア校のHuey Hwa Chan博士による、多言語社会における読書能力評価という極めて複雑な問題に取り組んだ研究です。特にマレーシアという、世界でも有数の言語的多様性を持つ国を舞台にした研究として、教育学や心理学の分野で重要な意味を持っています。
マレーシアは東南アジアに位置する多民族国家で、国語であるマレー語(Bahasa Melayu)、中国系住民が使用する中国語(北京官話)、インド系住民のタミル語、そして旧宗主国の影響で広く使われる英語など、複数の言語が日常的に使用されています。これらの言語は単に話されるだけでなく、それぞれ異なる文字体系を持っており、子どもたちは同時に複数の文字を学習する環境にあります。
このような言語環境の複雑さが、読書困難や失読症(ディスレキシア)の診断を極めて困難にしています。従来の読書能力テストは、特定の言語や文化的背景を前提として作られているため、多言語環境で育った子どもや大人に適用する際に、真の読書能力ではなく、言語習熟度や文化的知識の差を測定してしまう可能性があります。
動的テストという新しいアプローチ
研究者たちが注目したのは「動的テスト(Dynamic Testing)」という比較的新しい評価手法です。この手法は、既存の知識や特定言語の習熟度を測るのではなく、新しい記号と音の対応を学習する能力そのものを評価しようとするものです。
具体的には、参加者に人工的な文字体系を教え、その学習過程と結果を観察します。この研究では、3つの新しい記号(╔=/s/, ◊=/m/, ◘=/α/)を使用し、参加者がこれらの記号と音の対応を覚え、組み合わせて「単語」を読む能力を測定しました。このアプローチの理論的根拠は、読書学習の根本的な能力である「文字と音を結びつける力」を、特定の言語に依存せずに測定できるというものです。
デンマークのElbro博士らの先行研究(2012年)では、この動的テストが従来の読書テストと高い相関を示しながらも、教育レベルや語彙力などの「環境要因」との相関は中程度に留まることが示されていました。これは、動的テストが真の読書能力を測定している可能性を示唆していました。
研究方法の詳細
今回の研究では、59名のマレーシア成人(平均年齢22.3歳)を対象として、複数の測定を実施しました。参加者の大多数は女性で、心理学専攻の大学生が多く含まれていました。
研究で使用された測定方法は多岐にわたります。まず、参加者の言語的背景を詳しく調べるため、修正版の言語・社会的背景質問票(LSBQ)を使用しました。これにより、どの言語を最初に話し始めたか、どの文字を最初に覚えたか、現在最も得意とする言語は何かなどを把握しました。
読書能力の評価には複数のアプローチが採用されました。まず、成人読書歴質問票(ARHQ)という自己報告式の測定により、読書困難の可能性を評価しました。これは幼少期の読書経験、家族内での読書困難の歴史、現在の読書に対する態度などを5点尺度で評価するものです。
さらに、より客観的な読書能力の測定として、英語、中国語、マレー語の3言語での語彙判断課題(LDT)を実施しました。これは、画面に表示される文字列が実在する単語かどうかを、できるだけ正確かつ迅速に判断する課題です。反応時間と正確性の両方が測定されました。
音韻認識能力を測定するため、マレー語の単語を使った音素数えタスクも実施されました。参加者は、書かれた単語に含まれる音の数を数えるという課題です。例えば「bumi」という単語の場合、/b/ /u/ /m/ /i/の4つの音素があることを認識できるかを測定します。
研究結果の概要
研究の結果、動的テストは音韻認識能力や読書歴質問票と有意な相関を示しました。これは動的テストが読書関連能力を測定している証拠として解釈されました。一方で、より客観的な読書能力の指標である語彙判断課題とは有意な相関を示しませんでした。
興味深いことに、語彙判断課題の反応時間で参加者を「読書速度が速いグループ」と「遅いグループ」に分けて比較すると、速いグループの方が動的テストでも高い得点を示しました。これはElbro博士らの先行研究と一致する結果でした。
最初に学んだ文字体系による影響を調べるため、参加者を「表音文字グループ」(英語やマレー語を最初に学んだ人々)と「表意文字グループ」(中国語を最初に学んだ人々)に分けて分析しました。その結果、動的テストの得点自体には両グループ間で有意差は見られませんでした。
しかし、より詳細な分析を行うと、表音文字グループでは動的テストが読書困難の予測に有効でしたが、表意文字グループでは予測力が認められませんでした。この結果は、先行研究で示唆されていた「動的テストは表音文字系の言語により適している」という仮説と一致するものでした。
方法論の批判的検討
この研究には評価すべき点が多くある一方で、いくつかの重要な方法論的限界も存在します。
まず、サンプルサイズの問題があります。59名という参加者数は統計分析に最低限必要な数は満たしているものの、さらに細かいグループ分析を行う際には統計的検出力が不足する可能性があります。特に、表音文字グループと表意文字グループに分けた際、それぞれ32名と27名という小さなサンプルでの比較となり、結果の解釈には慎重さが必要です。
測定方法についても課題があります。読書困難の「正解」となる基準の設定が困難でした。理想的には、複数言語で正式に失読症と診断された参加者を含むべきでしたが、マレーシアではそのような診断を受けた成人を十分な数確保することは困難でした。そのため、自己報告式の読書歴質問票と語彙判断課題という間接的な指標に頼らざるを得ませんでした。
語彙判断課題についても限界があります。これは単語認識の速度と正確性を測定する課題であり、必ずしも読書能力全体を代表するものではありません。また、この研究では主に英語での結果を重視していますが、これが参加者にとって第二言語である場合が多いことを考慮すると、真の読書能力を反映していない可能性があります。
音韻認識課題にも問題があります。この課題では、書かれた単語を見て音素の数を数えさせていますが、真の音韻認識能力を測定するためには聴覚的な刺激のみを使用すべきです。書字に依存した課題では、すでに読書能力の影響を受けてしまう可能性があります。
理論的含意と解釈の問題
この研究は、読書学習における普遍的能力と言語特異的能力の関係という重要な理論的問題に関連しています。Verhoeven博士とPerfetti博士(2022年)の理論では、「文字が言語を表現する」という基本的な学習過程は言語を超えて共通しているとされています。この研究の結果は、この理論を部分的に支持しているように見えます。
しかし、表音文字グループと表意文字グループで異なる結果が得られたことは、言語特異的な要因の重要性も示唆しています。中国語のような表意文字系では、文字と音の対応よりも、文字と意味の直接的な対応がより重要な役割を果たしている可能性があります。
ただし、この解釈には注意が必要です。マレーシアの言語環境は、研究者たちが想定したような「順次的多言語習得」(第一言語を完全に習得してから第二言語を学ぶ)ではなく、「同時的多言語習得」(複数の言語を同時に学ぶ)である場合が多いためです。参加者の多くは幼少期から複数の言語に同時に接触しており、どれが「第一言語」かを明確に特定することは困難です。
実用的意義と課題
この研究の実用的意義は大きいと考えられます。多言語環境での読書困難の診断という課題は、グローバル化が進む現代社会においてますます重要になっています。移民の子どもたち、国際結婚家庭の子どもたち、国際学校に通う子どもたちなど、複数言語環境で育つ子どもは世界的に増加しています。
従来の単一言語を前提とした読書テストでは、これらの子どもたちの真の能力を適切に評価できません。その結果、真の読書困難を見逃したり、逆に言語習熟度の問題を読書困難と誤診したりするリスクがあります。動的テストのようなアプローチが成功すれば、より公平で正確な評価が可能になります。
しかし、実際の教育現場での応用には多くの課題があります。まず、テストの実施には訓練を受けた専門家が必要であり、時間とコストがかかります。また、この研究で使用された動的テストは、参加者の約17%が第2段階で脱落してしまい、最終得点が0点となりました。これは、テストの難易度設定や実施方法に改善の余地があることを示しています。
さらに、文化的適応の問題もあります。この研究で使用された記号や音は西欧系の言語を基準としており、他の文化圏の参加者にとって適切かどうかは検証が必要です。
データ解釈の妥当性について
この研究のデータ解釈にはいくつかの疑問点があります。まず、動的テストと音韻認識能力の間に見られた相関(r≈0.27)は統計的に有意でしたが、効果サイズとしては小さめです。先行研究で報告されていた相関(r≈0.5)と比較すると、この研究での関連性は弱いと言えます。
また、語彙判断課題との相関が認められなかったことも重要です。もし動的テストが真の読書能力を測定しているなら、より客観的な読書測定との間により強い関連が期待されます。研究者たちは、語彙判断課題の限界を理由として挙げていますが、この説明だけでは不十分かもしれません。
統計分析の手法についても検討の余地があります。この研究では、参加者を言語的背景によってグループ分けして分析していますが、グループ間の比較には十分な統計的検出力がありません。また、多重比較の問題についても適切に対処されていません。
今後の研究への示唆
この研究は、多言語環境での読書評価という重要な領域において価値ある貢献をしていますが、同時に今後の研究で取り組むべき多くの課題も明確にしています。
まず、より大規模で多様な参加者を含む研究が必要です。特に、正式に失読症と診断された多言語話者を含めることで、動的テストの診断的妥当性をより厳密に検証できるでしょう。また、子どもを対象とした縦断研究により、動的テストの予測的妥当性を確認することも重要です。
測定方法の改善も必要です。現在の動的テストは脱落率が高く、二峰性の分布を示すため、より連続的で正規分布に近い測定方法の開発が求められます。また、表意文字系言語の特性を考慮した動的テストの開発も重要な課題です。
文化的適応についても、より系統的な検討が必要です。異なる文化圏で育った参加者に対して、どのような記号や音が適切かを検証し、文化的に中立な測定方法を開発することが求められます。
結論
この研究は、多言語環境における読書能力評価という困難な問題に対して、革新的なアプローチを提示した価値ある研究です。動的テストという手法が、言語や文化的背景に左右されにくい読書能力の測定方法として有望であることを示しました。
しかし同時に、この手法にはまだ多くの限界があることも明らかになりました。特に、表意文字系言語に対する適用可能性については、さらなる検討が必要です。また、実用化に向けては、測定方法の改善、文化的適応、実施の簡便化など、多くの課題が残されています。
それでも、この研究が提起した問題意識と提案したアプローチは、グローバル化社会における教育評価の公平性向上に向けた重要な一歩と評価できます。今後の継続的な研究により、より多くの子どもたちが適切な教育支援を受けられるような評価方法の開発が期待されます。
また、この研究は学際的な視点の重要性も示しています。言語学、心理学、教育学、認知科学などの知見を総合的に活用することで、複雑な現実の問題により効果的に対処できることを示したと言えるでしょう。
Pye, R. E., & Chan, H. H. (2023). Dynamic tests as a language-free method for assessing reading in a multilingual setting. Journal of Cultural and Cognitive Science, 7, 147–158. https://doi.org/10.1007/s41809-023-00120-8