教壇に立つ教師なら、誰もが一度は「もっと一人ひとりの生徒に目を向けたい」と思ったことがあるはずです。30人、あるいは40人のクラスで、全員の理解度を把握し、つまずいている生徒にすぐ手を差し伸べ、適切な教材を選び、さらに採点まで行う。それが現実の教師の日常です。人工知能(AI)がそこに入り込んできたとき、何が変わり、何が変わらないのか。Ismail Celik、Muhterem Dindar、Hanni Muukkonen、Sanna Järveläの4名がフィンランド・オウル大学から2022年に発表した論文、”The Promises and Challenges of Artificial Intelligence for Teachers: a Systematic Review of Research”は、その問いに正面から向き合った力作です。

研究の背景と目的

筆者たちはフィンランドの研究者です。フィンランドといえば、PISA(国際学習到達度調査)で長年上位を維持し、世界中の教育関係者が注目する国です。その地で教育技術を研究するチームが、AIと教師の関係を体系的に整理しようとした背景には、切実な問題意識があります。AI開発者は学習科学の知識に乏しく、教師という最重要のエンドユーザーの期待を無視しがちだ、というのです。これはフィンランドに限らず、日本でも思い当たる節があるのではないでしょうか。EdTechと呼ばれる教育技術企業が次々と新しいツールを学校に持ち込んでも、現場の教師が使いこなせなかった、あるいはそもそも必要としていなかったという事例は枚挙に暇がありません。

この研究はWeb of Science(WoS)データベースを用いて、2020年9月14日までの20年間に発表された英語論文を対象に体系的レビューを実施しました。751本の候補から厳格な選定基準を適用し、最終的に44本を分析対象としています。選定されたのは、現職または養成課程の教師がAIを使った、あるいはAIが教師のデータを分析した実証研究です。高等教育は除外され、あくまでK-12(幼稚園から高校まで)の文脈に焦点が当てられています。分析には「オープンコーディング」という質的手法が用いられ、研究者2名が独立してコード化した後に議論によって合意形成するという手続きで信頼性を担保しています。

研究のトレンドが示すもの

44本の論文の分布を年代別に見ると、2004年に最初の研究が登場し、2018年以降に急増しています。44本の半数にあたる22本が2018年以降に発表されているという事実は、AIと教育の交差点がいかに急速に注目を集めるようになったかを端的に示しています。しかしそれでも、医療やビジネス分野と比べると教育分野でのAI研究は少ない。教育技術市場のデジタル変革が他分野より遅れている理由として、著者たちは「教師、教育者、伝統的な教科書出版社による抵抗」を挙げています。これは少々皮肉な指摘です。変革を求める声は上がりながら、いざ変革が訪れると現場が受け入れない。この矛盾は日本の英語教育現場でもしばしば見受けられます。

教師から何のデータが集められているか

論文が分析したAI研究において、教師から収集されたデータの種類は多岐にわたります。最も多かったのは自己報告データと採点データで、それぞれ全体の22%を占めていました。次いで観察データが18%、ビデオと面接がそれぞれ11%と続きます。ここで著者たちが特に問題視しているのは、生理的データの極端な少なさです。44本中、アイトラッキングや加速度センサーなどの生理的データを用いた研究はたった1本しかありませんでした(Prieto et al., 2018)。授業中の教師の視線の動き、歩き方、声のトーン――そういったデータを組み合わせることで、教師の「効果的な瞬間」をより精密に捉えることができるはずだと著者たちは主張します。確かに、ベテラン教師が生徒の理解をいち早く察知する「勘」のようなものは、アンケートや観察記録では到底とらえきれません。

AIの中で教師は何をしているか

この研究で特に興味深いのは、教師のAI研究における役割を7種類に分類している点です。最も頻繁に確認されたのは「AIのトレーニングデータとしてのモデル役」(18件)でした。つまり、熟練教師の行動や発話が、AIにとっての「正解データ」として使われているのです。Kelly et al.(2018)の研究では、教師の「本物の問い(authentic questions)」をAIが自動検出できるよう訓練するため、熟練教師の授業データが活用されました。教師はAIの道具になることで、逆説的に自分たちの実践の本質を問い直されているとも言えます。

他の役割としては、「教師自身の職能開発に関するデータをAIに提供する」(9件)、「生徒の特性・行動に関する情報をAIに供給する」(8件)、「AI採点の精度を確認するためのグレーダー」(5件)、「AI評価の基準を定める」(4件)、「教材選択の教育的指針を提供する」(3件)、「技術的問題にフィードバックを与える」(1件)が挙げられています。注目すべきは、養成課程の学生(プレサービス教員)が積極的にAIと関わった研究がほとんど存在しないという指摘です。これは大きな空白です。将来教壇に立つ学生たちへのAI教育が研究の俎上にほとんど乗っていないとすれば、教員養成のカリキュラム設計に携わる人々にとって急務の課題と言えるでしょう。

AIが教師にもたらす恩恵

研究で確認された恩恵は「計画」「実施」「評価」の三段階で整理されています。計画段階では、生徒の背景情報の提供や学習内容の選定支援が確認されました。たとえばPelham et al.(2020)の研究では、AIが生徒の非行リスク要因に関する情報を教師に提供しています。実施段階での最大の恩恵は「タイムリーなモニタリング」(12件)でした。Su et al.(2014)はAIによって教室内の生徒の集中度を教師がリアルタイムで把握できるシステムを開発しています。これができれば、「なんとなく今日の授業はうまくいっていない気がする」という曖昧な感覚が、データに基づいた判断へと変換されます。

「教師の負担軽減」(8件)、「即時フィードバックの提供」(7件)、「最適な学習活動の選択支援」(5件)も重要な恩恵として確認されました。教師の仕事量を減らすことへの期待は非常に大きく、Vij et al.(2020)やMa et al.(2020)など複数の研究でそれが強調されています。評価段階では「教師の実践の効果に関するフィードバック提供」(5件)と「自動採点・評価」(7件)が際立っています。Yuan et al.(2020)による中国語エッセイの自動採点システムは、採点の効率化だけでなく客観性の向上にも貢献するとされています。英語の四技能評価が叫ばれる日本の教育現場で、自動採点技術への関心が高いのは言うまでもありません。

立ちはだかる課題

しかし、課題も多い。最も多く確認された課題は「AIアルゴリズムの信頼性の低さ」(6件)です。Schwarz et al.(2018)はAIが教師に有用な情報を提供するには信頼性が不十分と指摘しています。「AIの技術的能力の限界」(3件)も顕著で、Fitzgerald et al.(2015)はAIが画像を含むテキストの複雑さを正確に評価できなかったと報告しています。英語のライティング授業でグラフや図表入りのエッセイを採点させようとしたとき、現在のAIはまだ壁にぶつかるわけです。

「複数の学習環境への適用困難」(2件)という課題も見逃せません。ある言語・ある文脈向けに設計されたAIが他の言語や文化で機能しないという問題は、日本の英語教育において特に深刻な含意を持ちます。英語母語話者向けの自動採点システムをそのまま日本人英語学習者に適用しようとしても、パターンが異なりすぎて機能しないケースは十分考えられます。「教師のAI活用に関する技術的知識の不足」(1件)や「学校の技術的インフラの限界」(2件)も示唆的です。どれほど優れたツールがあっても、使う側の準備と環境が整っていなければ宝の持ち腐れになります。

どんなAI手法が使われているか

教師が関与した研究で使われたAI手法を見ると、人工ニューラルネットワーク(ANN)が16件と最多でした。次いで決定木が10件、ベイジアンと感情ロジックがそれぞれ6件と続きます。深層学習(Deep Learning)は1件のみというのは意外かもしれませんが、この研究の対象期間(2020年9月まで)を考えると、深層学習が教育AIに本格的に応用されるのはまさにこれからという時期だったとも言えます。教科別の分布を見ると、STEM(理数系)関連が46%と最大で、英語が14%、数学が14%でした。英語教育でのAI活用研究が一定数蓄積されていることは、日本の英語教育関係者にとって参考になる事実です。特に自動エッセイ採点や適応的フィードバックの研究が英語コースで多く実施されているという点は、CEFRに基づくライティング評価の効率化を模索している現場に直接響く情報です。

日本の英語教育への示唆

この論文を日本の英語教育の文脈で読み直すと、いくつかの重要な示唆が浮かび上がります。まず、採点負担の軽減という観点です。日本では英語教師が膨大な数のライティング課題を抱え、添削に追われているという現実があります。自動採点技術の精度が上がれば、教師はより質の高いフィードバックを考える時間が生まれます。ただし、この研究が示すように現状のシステムにはまだ信頼性の問題があり、教師が結果を批判的に読む力を持つことが前提になります。

次に、プレサービス教員(教員養成課程の学生)へのAI教育の不在という空白の問題です。日本でも大学の英語教員養成課程でAIリテラシーを教えている例はまだ少数派です。将来の教師がAIをただ使うだけでなく、その仕組みや限界を理解し、教育的判断の主体として活用できるよう育てることが求められます。この研究は「プレサービス教員のAI活用研究がほぼ存在しない」という空白を明示しており、それ自体が今後の研究課題を示す道標となっています。

また、文化的・言語的文脈の問題も重要です。英語母語話者を前提としたAIシステムが日本語環境でどう機能するか、あるいは日本人英語学習者の特有のエラーパターンをAIがどう扱うかは、輸入したツールをそのまま使う前に検証されるべき事項です。この論文はその点の注意を間接的に促しています。

研究の限界と今後への期待

この研究にも限界があります。Web of Scienceというデータベースに限定しているため、日本語や他の言語で発表された重要な研究が抜け落ちている可能性があります。また、44本という規模はメタアナリシスとしては小さく、量的な一般化には慎重さが求められます。さらに、「教師の視点」という軸を設定しながら、実際には教師が「研究の対象」として登場しているケースと「AI活用の主体」として登場しているケースが混在しており、そこを丁寧に区別する議論がもう少し欲しいと感じます。

それでも、この研究が持つ意義は大きい。AI開発者と教育実践者の乖離という根本的な問題を正面から取り上げ、「教師こそがAI教育の中核にいる」というメッセージを発し続けていることは、技術中心主義に陥りがちなEdTech言説に対する重要なカウンターバランスです。Järveläをはじめとするオウル大学のチームは、学習の自己調整(self-regulated learning)や協調学習の分野で国際的に著名であり、その蓄積が技術の評価にも反映されています。

AIは教師を代替するものではない。それは今や多くの研究者が合意する前提です。しかしこの論文は、AIが教師に何をもたらし得るかをデータから丹念に掘り起こすことで、「代替か否か」という議論を超えた実践的な問いを投げかけています。教師がAIの仕組みを理解し、その開発にも関わり、最終的な教育的判断を自ら下す。そのような姿を実現するためには、現場の教師、研究者、AI開発者、そして教員養成に関わる者が、互いの言語で対話できる場を作ることが第一歩になるでしょう。この論文はその対話を始めるための素材として、十分な価値を持っています。


Celik, I., Dindar, M., Muukkonen, H., & Järvelä, S. (2022). The promises and challenges of artificial intelligence for teachers: A systematic review of research. TechTrends, 66(4), 616–630. https://doi.org/10.1007/s11528-022-00715-y

最新の研究の解説記事を見逃したくない方へ
膨大な論文の中から、読むべき重要研究を厳選し、わかりやすくまとめた記事を毎週土曜日に届けします。 忙しい先生のための情報収集ツールとしてお使いください。
icon

By 吉成 雄一郎

株式会社リンガポルタ代表取締役社長。東京電機大学教授、東海大学教授を経て現職。コロンビア大学大学院ティーチャーズカレッジ(英語教授法)、信州大学大学院工学研究科(情報工学)修了。専門は英語教授法、英語教育システム開発。 さまざまな英語学習書、英検、TOEIC 対策書、マルチメディア教材等を手がけてきた。英語eラーニングや英語関係の教材・コンテンツの研究開発も行う。全国の大学、短期大学、高専等で使われているeラーニングシステム「リンガポルタ」も開発した。最近ではAIによる新しい教育システムの開発にも着手している。

📖新刊情報|英語教育学海外論文解説: 海外の研究をサクッと解説』の最新号(第9号)が刊行されました!▶特集テーマ:EFLにおける批判的思考力の育成―最前線の研究レビュー

X
Amazon プライム対象