筆者と研究の背景
この論文”Opening Pandora’s Box: How does peer assessment affect EFL students’ writing quality?”の著者であるEleni Meletiadouは、ロンドン南岸大学(London South Bank University)のビジネススクールに所属する研究者です。キプロスという地中海の島国で育ち、そこでの英語教育の現状を目の当たりにしてきた彼女は、特に中高生の英語ライティング能力の向上に強い関心を持っています。
キプロスは観光業と国際貿易が盛んな国です。そのため、英語は単なる学校の科目ではなく、将来の就職や生活に直結する重要なスキルとなっています。多国籍企業では英語でのメール作成や文書作成が日常的に求められ、IGCSE(国際中等教育修了証)やIELTSといった外部試験でもライティング能力が厳しく問われます。しかし、現実には多くの生徒が作文に苦手意識を持ち、試験でも思うような成績を上げられないという問題がありました。
そんな中、Meletiadouが注目したのが「ピアアセスメント」、つまり生徒同士が互いの作文を評価し合う方法でした。この論文は、2021年に学術誌「Languages」に掲載されたもので、ピアアセスメントが実際にどれほどの効果を持つのかを、厳密な実験デザインと詳細なテキスト分析によって検証した研究です。
ピアアセスメントとは何か―給食当番のような学び
ピアアセスメントという言葉は専門的に聞こえるかもしれませんが、考え方自体はそれほど難しくありません。たとえば、小学校の給食当番を思い出してください。最初は先生が配膳の仕方を教えますが、やがて子どもたちは互いに「もっとこうした方がいいよ」「ここはうまくできてるね」と声をかけ合うようになります。この相互フィードバックのプロセスこそが、ピアアセスメントの本質です。
教育の現場では、従来、評価は教師の専権事項とされてきました。教師が赤ペンで間違いを指摘し、点数をつけ、コメントを書く。生徒はそれを受け取るだけ。しかし、この一方通行の評価方法には限界があります。教師一人で200人分の作文を丁寧に添削するのは物理的に困難ですし、生徒の側も「先生から指摘された」というだけでは、本当の意味で理解が深まらないこともあります。
そこで登場するのがピアアセスメントです。生徒たちが互いの作文を読み、評価し、アドバイスし合うことで、評価される側だけでなく評価する側も学びを得られるという考え方です。他人の作文を読むことで「ああ、こういう表現もあるのか」と気づいたり、「自分もこんな間違いをしているかも」と振り返ったりする機会が生まれます。
研究の設計―200人の生徒を追った9か月間
Meletiadouの研究は、非常に大規模で丁寧に設計されています。キプロスの4つの公立中学校から200人の生徒と20人の経験豊富な英語教師が参加しました。生徒たちは全員、中級レベル(ヨーロッパ言語共通参照枠のB1レベル)の英語力を持つギリシャ系キプロス人です。
研究は実験群と対照群に分けて行われました。実験群の100人は、作文を書く際に2つの下書きを作成し、1回目の下書きには同級生からのピアアセスメントを、最終稿には教師からの評価を受けました。一方、対照群の100人は、両方の下書きで教師からのみ評価を受けました。つまり、唯一の違いは「ピアアセスメントがあるかどうか」です。この違いによって生じる作文の質の変化を測定することで、ピアアセスメントの純粋な効果を明らかにしようとしたのです。
研究期間は9か月間、丸々1学年にわたって続けられました。生徒たちは週2回、各90分の英語ライティングの授業を受け、その中で記述文、物語文、論説文という3種類の作文を学びました。教師たちも事前にピアアセスメントの方法について6時間の研修を受け、それを生徒たちに教えました。この研修では、評価基準の理解、模擬評価、評価用ルーブリック(採点基準表)の使い方などが含まれていました。
評価の道具―共通のものさしを持つこと
この研究で使われた評価ルーブリックは、よく知られたJacobsのESL作文評価プロファイルを改良したものです。内容、構成、語彙と言語使用、文法、焦点という5つのカテゴリーから構成され、それぞれに具体的な評価項目が設けられていました。
たとえば、「作文の目的が読者に明確に伝わっているか」「段落には明確な焦点と目的があるか」「洗練された多様な語彙が使われているか」「大文字の使い方に誤りはないか」「一貫した視点が保たれているか」といった項目です。さらに、3つの長所と3つの短所を具体的に指摘し、改善のための3つの具体的な提案を書く欄もありました。
このルーブリックは、8人の校長、1人の視学官、10人のベテラン英語教師の協力を得て妥当性が検証され、60人の生徒と6人の教師による予備調査で使いやすさが確認されました。信頼性を測るクロンバックのアルファ係数は0.9と高い値を示し、測定道具として十分な信頼性を持つことが確認されました。
評価の一貫性を保つため、すべての作文は外部の評価者によって採点され、そのうち20パーセントは研究者自身も採点して、評価者間の一致度を確認しました。こうした細心の注意は、研究結果の信頼性を高めるために不可欠なプロセスです。
何を測ったのか―4つの指標で見る作文の質
作文の質を評価するにあたって、Meletiadouは4つの指標に注目しました。これらは第二言語習得研究において、ライティング能力の向上を測る最良の指標とされているものです。
まず「流暢性」です。これは、限られた時間内にどれだけ多くの言葉を使って書けるかを示します。具体的には、作文全体の語数と、T-unit(最小の完結した文単位)あたりの平均語数を測定しました。料理に例えるなら、同じ30分でどれだけ多くの料理を作れるか、ということです。
次に「文法的複雑性」です。これは、単純な文ではなく、複雑な構造の文をどれだけ使えるかを見るものです。T-unitあたりの節の数、従属節の使用頻度などを測定しました。「私は学校に行った」という単純な文よりも、「雨が降っていたにもかかわらず、私は学校に行った」という複雑な文の方が、文法的複雑性が高いということです。
3番目は「正確性」です。文法的な誤りがどれだけ少ないかを示します。誤りのないT-unitの割合や、T-unitあたりの誤りの数を測定しました。いくら長い文章を書いても、間違いだらけでは意味がありません。
最後に「語彙的複雑性」です。どれだけ多様で洗練された語彙を使えているかを測ります。ここでは、語の種類数を総語数の平方根の2倍で割った比率を使いました。これは、作文の長さに左右されずに語彙の多様性を測定できる方法です。
発見された効果―数字が語る現実
統計分析の結果は明確でした。実験群と対照群の間には、4つの指標すべてにおいて統計的に有意な差が見られたのです。専門的には、多変量分散分析(MANOVA)という手法を用いて、F値が3.461、有意確率が0.005未満という結果が得られました。これは、偶然ではなく、ピアアセスメントが確かに効果を持っていることを示しています。
より詳しく見ていくと、ピアアセスメントは特に語彙的複雑性に顕著な効果をもたらしました。実験群の生徒たちは、より多様で洗練された語彙を使うようになったのです。これは、仲間の作文を読むことで、「ああ、こんな言い方もあるのか」という発見があったためと考えられます。
正確性の面でも、すべての指標において統計的に有意な改善が見られました。誤りのないT-unitの数が増え、T-unitあたりの誤りが減ったのです。他人の間違いを指摘することで、自分自身の間違いにも気づきやすくなるという効果があったのでしょう。
文法的複雑性については、一部の側面で改善が見られました。特に、T-unitあたりの節の数、つまり独立節の使用が増えました。ただし、従属節の使用については有意な改善が見られませんでした。これは、中級レベルの学習者にとって、従属節を使いこなすのはまだ難しいということを示しています。
流暢性についても、作文の長さ(総語数)とT-unitあたりの語数において改善が見られました。ただし、誤りのないT-unitあたりの語数や節あたりの語数については、有意な差は見られませんでした。
効果量(どれだけ実質的な差があるか)を見ると、語彙的複雑性と一部の文法的複雑性で中程度、正確性と一部の流暢性で小程度の効果が認められました。9か月間という期間と、生徒たちが受けた限られたトレーニングを考えると、これは十分に意味のある成果だと言えるでしょう。
なぜこのような効果が生まれたのか―学びのメカニズム
興味深いことに、実験群の生徒たちは主に「表面的な特徴」、つまり文法や語彙といった局所的な要素に焦点を当てて作文を修正していました。これは、中高生の段階ではまだ全体的な構成や論理展開といった抽象的な要素よりも、具体的で目に見える要素の方が扱いやすいためと考えられます。
しかし、この「表面的」な修正こそが、実は重要な学びにつながっていたのです。他人の作文を読んで「ここのスペルが違う」「この文法は間違っている」と指摘する過程で、生徒たちは自然と文法規則や正しい表現を再確認していました。そして、自分の作文に戻ったときに、「あ、自分も同じ間違いをしているかも」と気づくことができたのです。
これは、教育心理学で「メタ認知」と呼ばれる能力の発達と関係しています。自分の思考や学習プロセスを客観的に見る力です。他人の作文を評価するという行為は、自分の作文を客観的に見る訓練にもなっているのです。
また、仲間の作文を読むことで、多様な表現方法や書き方に触れることができました。10人いれば10通りの書き方があります。そうした多様性に触れることで、「こんな書き方もあるんだ」という気づきが生まれ、語彙の幅が広がったと考えられます。
対照的な研究結果との対話―なぜ意見が分かれるのか
興味深いのは、ピアアセスメントの効果については研究者の間でも意見が分かれているという点です。Meletiadouの論文でも、様々な先行研究が引用されており、その中には相反する結果を報告しているものもあります。
たとえば、Jalalifarahani and Azizi(2012)は、ピアフィードバックは文法的正確性の向上には役立たないと報告しています。また、Hashemifardnia et al.(2019)も、文法的正確性の向上には教師のフィードバックが必要だと主張しています。一方で、Ruegg(2015)やChien et al.(2020)は、教師のコメントがピアのコメントよりも必ずしも効果的というわけではないと報告しています。
なぜこのような違いが生まれるのでしょうか。それは、研究の設計、対象者の年齢や習熟度、ピアアセスメントの実施方法、測定する指標など、様々な要因が関係しているからです。まるで料理のレシピのように、同じ「ピアアセスメント」という材料を使っても、調理法や他の材料との組み合わせ方によって、まったく違う結果が生まれるのです。
Meletiadouの研究が重要なのは、こうした多様な結果の中で、特に中等教育の現場における中級レベルの学習者に焦点を当て、9か月という長期間にわたって、200人という比較的大きなサンプルで、4つの異なる側面から作文の質を分析したという点です。これは、ピアアセスメント研究の中でも非常に包括的な取り組みだと言えます。
教育現場への示唆―先生たちへのメッセージ
この研究から、教育現場にはどのような示唆が得られるでしょうか。
まず、ピアアセスメントは決して大学生や大人だけのものではないということです。多くの研究者は、中高生にはまだ早いと考えていましたが、Meletiadouの研究は、適切な準備とサポートがあれば、青年期の学習者でも十分にピアアセスメントを活用できることを示しました。
ただし、そのためには教師の役割が重要です。6時間にわたる事前研修や、明確な評価基準の提示、段階的な導入など、丁寧な準備が必要です。いきなり「さあ、友達の作文を評価してみて」と言っても、生徒たちは戸惑ってしまうでしょう。
また、ピアアセスメントは教師の評価を完全に置き換えるものではなく、それを補完するものとして位置づけるべきだということも重要です。この研究の実験群は、ピアアセスメントと教師評価の両方を受けています。二つのフィードバックを組み合わせることで、より効果的な学びが実現したのです。
評価ルーブリックの設計も重要なポイントです。生徒たちが理解しやすく、具体的な指針を提供できるものである必要があります。Meletiadouが使用したルーブリックには、単に「良い」「悪い」という判断だけでなく、「なぜ良いのか」「どう改善すればいいのか」という具体的なフィードバックを求める欄が設けられていました。
限界と今後の課題―完璧な研究は存在しない
Meletiadou自身も認めているように、この研究にはいくつかの限界があります。
まず、データ収集の方法です。作文の分析という客観的なデータはありますが、生徒たちがピアアセスメントをどう体験したか、どう感じたかといった主観的なデータは限られています。もし、インタビューや日記、思考発話法(考えながら話してもらう方法)などを組み合わせていれば、より深い理解が得られたかもしれません。
また、対象がキプロスという特定の文化的・教育的文脈に限られている点も考慮すべきです。キプロスでは従来、評価は教師の専権事項とされてきました。異なる教育文化を持つ国では、同じ方法でも異なる結果が出る可能性があります。
研究期間の9か月という長さは印象的ですが、より長期的な効果を知るには、さらに追跡調査が必要でしょう。生徒たちが学んだスキルは、翌年、あるいは卒業後も持続するのでしょうか。
さらに、この研究で改善が見られなかった側面、特に従属節の使用や一部の流暢性指標については、より長い時間やより集中的なトレーニングが必要かもしれません。あるいは、ルーブリックにこれらの要素をより明示的に組み込むことで、改善が見られる可能性もあります。
社会文化的な視点―学びは社会的な営み
Meletiadouの研究は、社会文化理論の重要性も示唆しています。学びは個人の頭の中だけで起こるものではなく、他者との相互作用の中で構築されるという考え方です。
ピアアセスメントは、まさにこの社会的学習の場を作り出します。生徒たちは互いに教え合い、学び合い、時には意見が対立し、それを解決していく中で、より深い理解に到達します。これは、将来社会に出たときに必要とされる協働スキルの育成にもつながります。
21世紀の社会では、個人で黙々と作業する能力だけでなく、チームで協力し、互いの意見を尊重しながら共通の目標に向かって働く能力が求められています。ピアアセスメントは、こうした「ソフトスキル」を育てる機会でもあるのです。
また、「学習共同体」という概念も重要です。クラスを、教師が知識を一方的に伝達する場ではなく、全員が学び合う共同体として捉え直すことで、生徒たちの学びへの態度も変わってきます。自分だけでなく仲間の成長にも責任を感じ、互いに支え合う関係が生まれるのです。
評価の役割を再考する―学びのための評価
この研究は、「評価とは何のためにあるのか」という根本的な問いを投げかけています。
従来の評価は、多くの場合「学習の評価」でした。つまり、生徒が何を学んだかを測定し、成績をつけるためのものです。しかし、ピアアセスメントは「学習のための評価」という異なる役割を果たします。評価そのものが学習の機会となり、成長を促すツールとなるのです。
Meletiadouは、これを「学習志向型評価」と呼んでいます。評価が単なる測定ではなく、学習プロセスの一部として機能するという考え方です。生徒たちは評価を通じて、「良い作文とは何か」を理解し、自分の作文を改善する具体的な方法を学んでいきます。
また、この研究は「妥当性の結果」という重要な概念にも触れています。これは、評価が学習にどのような影響を与えるかという問題です。テストは単に知識を測るだけでなく、何を学ぶべきか、どう学ぶべきかというメッセージを生徒に送ります。良い評価システムは、望ましい学習行動を促進するものなのです。
実践への橋渡し―どう始めるか
では、この研究結果を実際の教室でどう活かせばよいのでしょうか。
まず、小さく始めることが大切です。いきなり全面的にピアアセスメントを導入するのではなく、一つの課題から試してみるとよいでしょう。たとえば、最初は内容や構成といった抽象的な要素ではなく、スペルや文法といった具体的な要素に焦点を当てることで、生徒たちも取り組みやすくなります。
評価基準を明確にすることも重要です。「良い作文」の基準を生徒たちと一緒に話し合い、具体例を示しながら理解を深めていきます。評価は主観的で曖昧なものではなく、共有された基準に基づいた客観的なものだという認識を育てることが必要です。
匿名性の確保も検討する価値があります。Meletiadouの研究では、生徒たちは匿名で互いの作文を評価していました。これにより、友情関係や気まずさを気にせず、率直なフィードバックを与えやすくなります。
そして、継続的なサポートです。Meletiadouは週に一度、教師たちと会議を持ち、問題を解決し、追加のトレーニングを提供していました。ピアアセスメントは一度教えれば終わりというものではなく、継続的な指導と改善が必要なプロセスなのです。
グローバルな文脈での意義―キプロスを超えて
キプロスという小さな島国で行われたこの研究ですが、その意義は世界中の英語教育に及びます。グローバル化が進む現代において、英語は国際的なコミュニケーションの共通語となっており、特にライティング能力の重要性は増す一方です。
多くの国で、日本を含めて、生徒たちは英語のライティングに苦戦しています。教師一人で多くの生徒の作文を丁寧に添削する時間がない、生徒たちは書くことに対して消極的、テストのための勉強になってしまい本質的な力が育たない、といった問題は共通しています。
ピアアセスメントは、こうした共通の課題に対する一つの答えを提供します。教師の負担を軽減しながら、生徒たちにより多くの学習機会を提供できるのです。また、評価を受ける側と評価する側の両方を経験することで、より深い学びが実現します。
ただし、文化的な違いには注意が必要です。協働学習や相互評価に対する態度は、文化によって異なります。ある文化では自然に受け入れられることが、別の文化では抵抗を感じられることもあります。導入にあたっては、その文化や教育システムの特性を考慮した適応が必要でしょう。
研究方法の強み―信頼できるエビデンス
この研究の大きな強みは、その厳密な研究デザインと詳細な分析にあります。
準実験デザインを採用し、実験群と対照群を設定することで、ピアアセスメントの純粋な効果を分離して測定しています。また、200人という比較的大きなサンプルサイズ、9か月という長期間の介入、400本の作文の詳細な分析といった点も、この研究の信頼性を高めています。
特筆すべきは、複数の側面から作文の質を評価している点です。多くの研究は、全体的な点数や一つ二つの指標だけを見ていますが、Meletiadouは正確性、流暢性、文法的複雑性、語彙的複雑性という4つの異なる側面から分析しています。これにより、ピアアセスメントがどの側面に特に効果的で、どの側面ではそうでないのかが明確になりました。
また、評価の信頼性を確保するための様々な措置も講じられています。外部評価者の使用、複数評価者による一致度の確認、評価ルーブリックの妥当性と信頼性の検証などです。これらの厳密な手続きにより、研究結果の信頼性が保証されています。
理論と実践の架け橋―研究がもたらすもの
学術研究がしばしば「象牙の塔」と批判されるのは、現場との乖離が大きいからです。しかし、Meletiadouの研究は、理論と実践をうまく結びつけています。
社会文化理論、メタ認知理論、形成的評価理論といった教育理論を基盤としながらも、実際の中学校の教室で、普通の教師と生徒を対象に実施されています。使用された教材も、キプロスの教育省が定めた標準的なカリキュラムと教科書です。つまり、特別な環境や優秀な生徒を前提としているわけではなく、どこにでもある普通の教室で再現可能な研究なのです。
また、この研究は単に「効果がある」ことを示すだけでなく、「なぜ効果があるのか」「どの側面に効果があるのか」「どの側面には効果が限定的なのか」という詳細な情報を提供しています。これにより、教師たちは自分の状況に応じて、ピアアセスメントをどう活用すればよいかを判断できます。
さらに、実施にあたっての具体的な手順、評価ルーブリックの例、トレーニングの内容なども示されており、実践のための青写真として活用できます。研究論文でありながら、実践的なガイドとしての機能も果たしているのです。
終わりに―開かれたパンドラの箱から
論文のタイトルは「Opening Pandora’s Box(パンドラの箱を開ける)」となっています。ギリシャ神話のパンドラの箱は、開けてはいけないものを開けてしまったという負の意味で使われることが多いのですが、実は箱の底には「希望」が残っていたという話でもあります。
ピアアセスメントという「箱」を開けることは、確かにある種のリスクを伴います。生徒たちが互いを正確に評価できるのか、友情関係が影響しないか、かえって混乱を招かないか、といった懸念は当然あります。しかし、Meletiadouの研究は、適切な準備とサポートがあれば、その箱の中には大きな「希望」が入っていることを示しています。
生徒たちの書く力が向上するだけでなく、評価する力、客観的に見る力、協働する力といった、21世紀を生きるために必要な様々な能力が育まれる。それがピアアセスメントの持つ可能性なのです。
もちろん、この研究は完璧ではありませんし、すべての疑問に答えているわけでもありません。しかし、それこそが研究の本質です。一つの研究が新たな問いを生み、さらなる探究を呼び起こす。Meletiadouの研究は、ピアアセスメント研究における重要な一歩であり、今後の研究と実践のための確かな基盤を提供しています。
教育の現場で働く人々、英語を教える人々、そして学習者自身にとって、この研究は重要なメッセージを伝えています。学びは一人で行うものではなく、共に行うものであり、評価は終点ではなく学びのプロセスの一部であるということを。そして、生徒たちは単に教えられる存在ではなく、互いに学び合い、高め合うことのできる能動的な学習者なのだということを。これこそが、より良い教育への道を開く鍵となるかもしれません。
Meletiadou, E. (2021). Opening Pandora’s Box: How does peer assessment affect EFL students’ writing quality? Languages, 6(3), Article 115. https://doi.org/10.3390/languages6030115
