はじめに―なぜ今、この論文を読むのか

コロナ禍で多くの英語教員がオンライン授業に放り込まれた経験は、日本の教育現場にも深い爪痕を残しました。「とにかくZoomで授業をする」という段階から、「オンラインならではの学びをどう設計するか」という問いへと関心が移行していくなかで、ピア評価(peer assessment)という手法があらためて注目を集めています。学習者同士が互いの成果物を評価し、フィードバックを与え合うこの活動は、教室の内外を問わず協働学習の核となりうるものです。

今回取り上げるのは、2023年にオープンアクセス誌 Languages に掲載されたYupeng LinとZhonggen Yuによる論文 “A Bibliometric Analysis of Peer Assessment in Online Language Courses”です。筆者の二人は北京語言大学(Beijing Language and Culture University)外国語学部に所属しており、Zhonggen Yuは教育工学と言語教育の交差点で活発に論文を発表している研究者です。Yupeng Linは修士課程の学生として本研究を主導しており、その意味でこの論文は若手研究者の意欲的な挑戦でもあります。本論文の方法論的核心は「書誌計量分析(bibliometric analysis)」であり、個々の論文の内容を深く読み込むのではなく、研究の全体的な地形図を描き出すことを目的としています。

書誌計量分析とは何か―研究者の地図作り

少し専門的な話になりますが、書誌計量分析とは、論文の数、引用関係、著者や所属機関のネットワークなどを統計的・可視化的に分析する手法です。個々の木を詳しく調べるのではなく、森全体の広がりを鳥瞰するようなアプローチだと考えるとわかりやすいでしょう。本論文ではVOSviewerとCitNetExplorerという二つのソフトウェアを使い、Web of Science(WOS)のデータベースから得た484件の論文を分析しています。

キーワード検索の組み合わせは「ピア評価 OR ピアフィードバック OR ピアレビュー」AND「オンライン」AND「ライティング OR スピーキング OR リスニング OR リーディング OR 言語」というかなり広い設定で、教育学・言語学・コミュニケーション学などの研究領域に絞り込まれました。

この手法の最大の強みは、一人の研究者が手作業で読み切れないほどの大量の文献を俯瞰できる点です。一方で、個々の研究の質や細部の議論にはほとんど踏み込めないという限界もあります。本論文の著者たちもこの点を誠実に認めており、論文の価値はその自己批評的な姿勢によっても支えられています。

主な発見―何がわかったのか

本論文の中心的な発見は大きく六つの問いに沿って整理されています。まず出版トレンドという観点では、オンライン語学教育におけるピア評価の研究は2019年前後から急増しており、2021年には83件と過去最高を記録しています。COVID-19が遠隔授業の必要性を一気に高めたことが、この爆発的増加の主な原因として挙げられています。これは日本の英語教育関係者にとっても実感を伴う話でしょう。2020年以降、多くの大学や高校が対面授業を取りやめ、手探りでオンライン授業を始めたあの時期に、世界中の研究者もまた、同じ問いと向き合っていたわけです。

研究が掲載された雑誌を見ると、Computers & Education が22件(4.55%)でトップ、次いで Computer Assisted Language Learning が19件(3.93%)となっており、言語教育と教育工学の交差点に位置する雑誌が上位を占めています。これはこの分野の学際的な性格をよく示しています。キーワードの分析からは、「feedback」「peer feedback」「students」「online」「education」などが高頻度で登場し、468個のキーワードが17のクラスターに分類されました。注目すべきは、心理学的な概念―「motivation」「perceptions」「self-efficacy」―が頻繁に登場していることです。言語習得の研究が、学習者の内的状態への関心を深めていることがここからも読み取れます。

研究の主要な担い手という点では、米国・中国・英国・スペイン・オーストラリアが上位国として並びます。日本はこのリストに登場しません。この不在は、後述する日本の英語教育への示唆を考えるうえで重要なポイントです。

引用ネットワーク分析―誰が誰を参照しているか

書誌計量分析の中でも、本論文が特に力を入れているのが引用ネットワーク分析です。457件の論文(オンライン先行公開論文を除いたもの)を CitNetExplorer で分類した結果、四つのクラスターが確認されました。最も大きいグループ1(G1、168件)はオンラインでの協働ライティングに焦点を当てた研究群、グループ2(G2、140件)はピア評価の学習成果や心理的・行動的側面に注目した研究群となっています。

引用関係をたどると、最も引用されている文献はVygotsky and Cole(1978)の Mind in Society で、40回もの引用を受けています。ヴィゴツキーの「最近接発達領域(Zone of Proximal Development)」は、同じ程度の知識・能力を持つ仲間からのフィードバックがなぜ有効かを説明する理論的基盤として、現在の研究にも脈々と受け継がれています。次いで引用数が多いのはTopping(1998)の総説論文で、ピア評価の類型・利点・信頼性・妥当性を包括的に論じたこの論文は、この分野の「始祖的文献」と呼べる存在です。

G2の最長引用経路を追うと、Topping(1998)からLatifi et al.(2021)まで8本の論文を経由するルートが複数存在し、その途中に共通して登場する文献群が特定されました。Gielen and De Wever(2015)によるピア評価における「評価者」と「被評価者」の役割設計の重要性、Liang and Tsai(2010)による自己評価・ピア評価・専門家評価の比較、そしてNoroozi et al.(2016)による高品質なフィードバックとライティング成果の関係といった研究が、現在の研究への架け橋となっています。この知識の連鎖を見ると、研究は決して孤立した点ではなく、長い時間をかけて編まれたネットワークであることが実感されます。

ライティング偏重の問題―日本の現場への問いかけ

本論文が指摘する重要な傾向のひとつが、ライティングスキルへの研究の集中です。G1のクラスターが示すように、オンラインでのピア評価研究の多くが、協働ライティングや文章推敲に焦点を当てています。なぜか。著者たちは、書き言葉の評価がリスニングやスピーキングの評価に比べて格段にやりやすいからだと説明しています。

これは直感的に理解しやすい話です。話し言葉は「その場限り」で流れ去ってしまいます。録音や録画を活用すれば記録は残せますが、音声・映像を再生しながら適切なコメントを書くことは、書き言葉の文章を読んでコメントするよりもはるかに手間がかかります。時間的なコストとフィードバックの精度という二つの壁が、スピーキングやリスニングへのピア評価の適用を難しくしているわけです。

日本の英語教育の文脈でこれを考えてみましょう。「4技能」の重要性が叫ばれながら、授業での評価活動はどうしてもライティングや読解中心になりがちです。スピーキングのピア評価をどう設計するか、どんな教育技術がその助けになるか―これは日本の英語教育が喫緊に取り組むべき実践的課題です。本論文はその問いを直接解くわけではありませんが、問いの輪郭を示しています。

教育テクノロジーとの統合―何が使われているか

本論文は、オンライン語学教育のピア評価に用いられている教育テクノロジーを丁寧にリストアップしています。最近の研究で言及されているものとしては、動画によるピアフィードバック、Google Docs を使った協働ライティング、MOOCs(大規模公開オンライン講座)でのピアレビュー、学習分析(learning analytics)、ビデオアノテーションツール、モバイルアプリなどが挙げられています。

特に印象的なのは、Haleem et al.(2022)が整理した教育テクノロジーの全体像と比較したとき、ピア評価の研究が取り上げているテクノロジーがまだその一部にとどまっているという指摘です。人工知能チャットボットは言語教育に導入されつつあるものの、その効果はいまだ議論の途中にあります。学習分析もピア評価の研究での活用はまだ限定的です。ChatGPTをはじめとする生成AIが急速に普及している2024年以降の教育現場を想定すると、本論文が描く「テクノロジーとピア評価の統合」の地図は、すでに更新を必要としている部分もあります。それでも、研究全体の傾向を把握するための基線として本論文の価値は失われていません。

著者たちは、教育テクノロジーの統合を考えるうえで三つの観点を提示しています。まず、テクノロジーの機能的特性(インタラクティビティ、学習ペースの調整可能性、没入感など)が学習内容と適合しているかどうかです。次に、既存テクノロジーの機能更新や新設計の可能性です。そして三つ目は、心理的・社会的・文化的・ジェンダー的な要因を含む複合的な要因への配慮です。この三点は、実践者にとっても設計の指針として有用です。

関連研究との対比―本論文の独自性はどこにあるか

書誌計量分析は教育研究においてすでにいくつかの先例があります。たとえば、テクノロジー支援型言語学習(CALL)の全体動向を分析した研究や、ピア評価の効果を定量的に総合するメタ分析(Li et al. 2020など)は存在します。しかし本論文が指摘するように、ピア評価とオンライン語学教育という組み合わせに絞った書誌計量分析、とりわけ引用ネットワークの分析は、これまでほとんど行われてきませんでした。

システマティックレビューやメタ分析との比較で言えば、書誌計量分析は「何が議論されてきたか」の全体像を示す一方で、「それぞれの研究が何を証明したか」を問う力は弱いです。本論文の著者たちもその点を率直に認めています。ただし、484件という規模の文献を一つの分析枠組みで整理できるのは書誌計量分析の明確な強みであり、研究の地形図を必要とする研究者や実践者には有益な出発点を提供してくれます。

一点、関連研究との比較で気になることがあります。本論文は引用ネットワーク分析の対象をWeb of Scienceの英語論文に限定しています。Scopusなど他のデータベースを加えていれば、また異なる地形図が描けた可能性があります。特に、ヨーロッパや東アジアの非英語圏における研究をより広く取り込めたかもしれません。日本の研究者による日本語論文はもちろん、韓国語・スペイン語・中国語などで書かれた論文も多く存在するはずですが、これらはこの分析からほぼ完全に除外されています。

日本の英語教育への示唆―距離と近さ

本論文で明示されてはいませんが、日本の英語教育の文脈から読み取れる示唆はいくつかあります。第一に、研究の生産量という観点からの日本の不在です。上位国として米国・中国・英国・スペイン・オーストラリアが挙げられる一方、日本はこのリストに姿を見せません。日本でも英語教育や外国語教育の研究は活発ですが、国際的な英語誌への投稿という点では貢献がまだ限られていることがうかがえます。これは研究の質の問題というよりも、言語的・制度的なハードルの問題である側面が大きいでしょう。

第二に、高等教育への偏りという問題です。本論文が示すように、ピア評価研究の多くが大学レベルを対象としています。日本では高校での英語4技能教育が政策的に推進されており、高校段階でのピア評価実践をどう研究・記録していくかは、現場の教員と研究者が連携して取り組む価値のあるテーマです。

第三に、ライティング以外の技能へのピア評価の可能性です。日本では英語スピーキングの評価が長年の課題となっており、動画フィードバックやモバイルアプリを活用したスピーキングのピア評価は、技術的にはすでに実現可能な段階にあります。それでも実践研究が少ないのは、教員の技術リテラシーの問題もありますが、ピア評価そのものへの文化的なためらいも関係しているかもしれません。「他の人を評価する」という行為に不慣れな学習者が多い日本の教室では、評価者と被評価者の役割設計についてGielen and De Weverが提起した問いが、特に重みを持って響きます。

方法論的な反省点と今後の方向性

研究の誠実さを測る指標のひとつは、自分の限界をどれだけ明確に示せるかです。本論文はその点でまずまずの評価ができます。英語論文に限定したこと、書誌計量分析がもたらす概観的な性格、引用経路の追跡が一部のグループにしか適用できなかったことなど、主要な限界が正直に記述されています。

ただ、一つ付け加えたい点があります。分析の出発点となる検索キーワードの設定が、最終的な結果に大きく影響するのが書誌計量分析の特徴です。本論文では「peer assessment」「peer evaluation」「peer feedback」「peer review」を同義語として扱っていますが、これらの概念は完全に互換的ではありません。Stovner and Klette(2022)が指摘しているように、「assessment(評価)」は総括的な意味合いが強く、「feedback(フィードバック)」は形成的なプロセスに近いです。この概念的な違いを検索段階で無視することで、分析対象が多少なりとも異質なものを含んでいる可能性があります。これは本論文の分析を無効にする問題ではありませんが、解釈の際に念頭に置いておく必要があります。

著者たちが提案する今後の研究方向には、現地語でのピア評価研究の推進、未開拓の教育テクノロジーの活用、高等教育以外の教育段階への拡張、そして将来的なメタ分析・システマティックレビューの実施が含まれています。これらはいずれも現実的かつ意義のある方向性です。特にメタ分析との組み合わせは、「広さを見る書誌計量分析」と「深さを見るメタ分析」の相補的な関係を活かすものとして期待されます。

締めくくりに―この論文が開く問い

本論文は、「ピア評価の研究が世界でどのように展開してきたか」を俯瞰する地図を提供してくれます。その地図は完璧ではありません。英語論文に限定されており、分析の粒度には限界があります。しかしそれでも、この地図を手にすることで、自分がどこに立っているかが少しはっきりします。

日本の英語教育の現場で働く我々にとって、この論文が投げかける最も重要な問いはこうかもしれません。「私たちの実践は、世界の研究の方向とどうつながっているか」「日本の教室でのピア評価の経験を、国際的な議論に貢献できる形で記録・発信しているか」。

オンライン授業が特別なものではなくなり、対面とオンラインの混合が当たり前になった今、ピア評価の設計はますます重要な教授法的課題になっています。本論文はその課題に向き合うための思考の出発点として、十分な価値を持っています。読み終えたとき、少し遠くまで見渡せるような気がする―そんな論文です。


Lin, Y., & Yu, Z. (2023). A bibliometric analysis of peer assessment in online language courses. Languages, 8(1), 47. https://doi.org/10.3390/languages8010047

 

By 吉成 雄一郎

株式会社リンガポルタ代表取締役社長。東京電機大学教授、東海大学教授を経て現職。コロンビア大学大学院ティーチャーズカレッジ(英語教授法)、信州大学大学院工学研究科(情報工学)修了。専門は英語教授法、英語教育システム開発。 さまざまな英語学習書、英検、TOEIC 対策書、マルチメディア教材等を手がけてきた。英語eラーニングや英語関係の教材・コンテンツの研究開発も行う。全国の大学、短期大学、高専等で使われているeラーニングシステム「リンガポルタ」も開発した。最近ではAIによる新しい教育システムの開発にも着手している。

📖新刊情報|英語教育学海外論文解説: 海外の研究をサクッと解説』の最新号(第7号)が刊行されました!▶特集テーマ:生成AIと共創するアカデミック・ライティング:英語教育における実践、評価、そして倫理

X
Amazon プライム対象