筆者と研究の背景
この論文”Exploring the practices on macro skills integrated assessment in Philippine higher education context: Basis in designing a language training program”の著者であるJennelyn Lacar Raymundoは、フィリピンのIsabela State Universityに所属する研究者です。フィリピンは英語を第二言語として使用する国であり、教育現場では英語が重要な位置を占めています。特に高等教育機関では、学生たちが将来グローバルな環境で活躍するために、英語の4技能―リスニング、リーディング、スピーキング、ライティング―を総合的に身につける必要があります。 しかし、実際の教育現場では、これらのスキルをバラバラに教え、バラバラに評価することが長らく続いてきました。まるで、料理を作る際に「野菜を切る技術」「火加減を調整する技術」「味付けをする技術」を個別に練習させるようなもので、最終的に美味しい料理を作れるかどうかは別問題という状態だったのです。 Raymundoはこうした問題意識から、実際の言語使用に近い「統合的評価」がどのように実践されているかを調査することにしました。この研究は、最終的には教師向けの研修プログラムを開発することを目指していますが、本論文ではその第一段階である「現状分析」の結果が報告されています。
統合的評価とは何か―日常生活との類似点
統合的評価について理解するために、私たちの日常生活を考えてみましょう。例えば、レストランで注文する場面を想像してください。メニューを読み(リーディング)、ウェイターの説明を聞き(リスニング)、質問をして(スピーキング)、場合によっては特別なリクエストを書く(ライティング)こともあります。このように、実際のコミュニケーションでは複数のスキルが同時に使われます。 従来の言語評価では、これらを切り離して「リーディングテスト」「リスニングテスト」というように別々に測定していました。しかし、それでは本当にその人が英語を使えるかどうかは分かりません。統合的評価は、より実際の言語使用に近い形で、複数のスキルを組み合わせて評価する方法なのです。 Raymundoは先行研究を丁寧にレビューし、統合的評価にはいくつかの定義があることを示しています。Karumpaら(2016)は「2つ以上の言語スキルを同時に使う能力を測定するもの」と定義し、Plakans(2013)は「リスニング、リーディング、スピーキング、ライティングを組み合わせた課題を使って、本物の言語使用場面を再現するもの」と説明しています。
研究の方法―質的アプローチの強み
この研究は「開発研究」と呼ばれるタイプの研究デザインを採用しています。開発研究とは、教育プログラムや教材を開発し、その過程を分析・評価する研究方法です。料理のレシピを開発するプロセスに似ていて、まず現状を調べ(分析)、試作品を作り(設計)、実際に試し(実装)、改善点を見つける(評価)という段階を踏みます。 本論文では、この最初の「分析」段階だけを報告しています。なぜなら、この種の研究は時間がかかり、質的データの分析も複雑だからです。著者は4人の言語教師全員と、10人の3年生英語専攻学生を対象に調査を行いました。学生については、評価のプロセスを理解し、実際に経験している3年生を意図的に選んでいます。 データ収集の方法は2つありました。1つは「文書分析」で、シラバスやテスト問題、評価基準表などを詳しく調べました。もう1つは「半構造化インタビュー」で、教師や学生に直接話を聞きました。特に興味深いのは、Covid-19の影響で学生へのインタビューはFacebookメッセンジャーを使って行われたという点です。これは、研究が現実の制約の中で柔軟に行われたことを示しています。
教師と学生が考える統合的評価の特徴
インタビューから浮かび上がってきた統合的評価の特徴は4つありました。 第一に「スキルの相互依存性」です。教師の一人(TP4と匿名化されています)は、「例えば、学生に何かを読ませて、それから聞かせて、それから質問に対して話させたり書かせたりする。そうすると、スキルがどのように相互依存的に使われているかが分かる」と説明しています。これは、言語スキルが孤立して存在するのではなく、互いに支え合っているという考え方です。 第二に「ソーステキストの使用」です。統合的評価では、読み物や音声、映像などを「足場」として提供し、それを基に学生が自分の考えを話したり書いたりします。学生の一人(SP6)は、「記事を読んだり映画を見たりして、それについて自分の意見や感想を書いた」と述べています。これは、何もないところから話したり書いたりさせるよりも、現実的で公平な評価方法だと言えます。 第三に「統合的ライティング・スピーキング課題の使用」です。教師の一人(TP1)は、「ほとんどの場合、ライティングとスピーキングに焦点を当てている。なぜなら、リーディングの能力は学生が書いたものから測定できるから。リスニング、リーディング、ビューイングは入力技能なので、それらの能力はスピーキングやライティングのパフォーマンスで既に評価できる」と説明しています。これは実践的な考え方ですが、後で述べるように、いくつかの問題も含んでいます。 第四に「課題の真正性と文脈化」です。統合的評価では、教室の外の実際の場面で使われるような課題を用いることが重視されます。そのため、エッセイなどの複雑な課題を評価するためにルーブリック(評価基準表)が必要になります。教師の一人(TP2)は、「ルーブリックは本当に必要です。特にライティングでは。学生にエッセイを書かせたとき、すぐに点数をつけることはできませんから」と述べています。
3つの課題タイプ―偏りのある実践
Raymundoは、Plakans(2013)の分類を使って、実際に使われている統合的評価課題を3つのタイプに分けて分析しました。合計141の課題を分析した結果、興味深い偏りが見つかりました。