研究の世界では、膨大な論文の海に溺れてしまうことがあります。特に「AIと教育」という領域は、コンピュータ科学、認知心理学、教授法、データサイエンスなど多くの分野が交差する複雑な領域であり、全体像をつかむことは容易ではありません。そこで登場するのが、本稿で取り上げるFengとLawによる論文 “Mapping Artificial Intelligence in Education Research: a Network-based Keyword Analysis” です。この研究は、2010年から2019年にかけて発表された1830本のAIED(Artificial Intelligence in Education)関連論文を対象に、キーワードのネットワーク分析という手法を駆使して、この分野の知識構造を鳥瞰的に描き出した意欲的な試みです。

著者のShihui Fengは香港大学教育学部の人間コミュニケーション・発達・情報科学ユニットに所属する研究者であり、Nancy Lawは同大学教員教育・学習リーダーシップユニットの研究者です。LawはAIEDおよび教育技術の分野で長年にわたって活躍してきた重鎮であり、香港を拠点としながら国際的な研究コミュニティに影響を与えてきました。この論文は、2020年2月に投稿され、2021年2月に受理・掲載という経緯をたどっており、コロナ禍によってオンライン学習への関心が世界的に急激に高まりつつある時期と重なっていることも興味深い背景といえます。

キーワードを「点」と「線」でつなぐ―ネットワーク分析とは何か

まずこの研究の手法について、専門外の方にも理解しやすいよう説明しておきましょう。キーワード共起ネットワーク(KCN: Keyword Co-occurrence Network)とは、論文に付与されたキーワードを「点(ノード)」として、同じ論文に登場するキーワード同士を「線(エッジ)」でつないだグラフ構造のことです。たとえば「machine learning(機械学習)」と「student modeling(学習者モデリング)」が同じ論文に登場すれば、この二つのキーワードの間に線が引かれ、その線の太さ(重み)は共起の頻度によって決まります。

この研究が特に優れているのは、単なる頻度分析にとどまらず、マクロ・メゾ・ミクロという三段階の分析枠組みを提案した点です。マクロレベルでは分野全体の知識構造の形状を把握し、メゾレベルでは密接に結びついたキーワードの「塊(クラスター)」を検出し、ミクロレベルでは個々のキーワードのネットワーク上の役割を特定します。これは、地図でたとえれば、まず大陸の輪郭を確認し、次に国や地域の境界を描き、最後に主要都市の位置と役割を確かめるようなものです。このような多層的なアプローチによって、「分野全体がどのような形をしているか」「どのテーマが中心的か」「どのトピックが今後有望か」という三つの問いに同時に答えることが可能になっています。

分析の対象と前処理―1830本の論文、3800のキーワード

分析対象となった論文は、AIED分野を代表する5つの主要な発表媒体から収集されました。具体的には、国際人工知能教育会議(AIEDC)、国際人工知能教育ジャーナル(IJAIED)、教育データマイニング国際会議(EDM)、ACM Learning at Scale会議(L@S)、インテリジェント・チュータリングシステム国際会議(ITS)の5つです。この選択方法は、キーワード検索によって論文を集めるのではなく、分野の主要な発表媒体をすべてカバーするという姿勢を示しており、網羅性と信頼性を高める工夫といえます。

前処理の段階では、複数形を単数形に統一したり、ハイフンを除去したり、略語を正式名称に統一したりという細かな標準化作業が行われており、3800の独自キーワードが最終的なデータセットとして確定しています。こうした地道な作業が、後続の分析の精度を支えているわけです。現場の教員が授業準備のために参考文献を整理する作業に似た、縁の下の力持ち的なプロセスだといえるでしょう。

マクロ分析が示す「ベキ乗則」―少数のキーワードが知識をつなぐ

マクロレベルの分析では、AIEDのキーワード共起ネットワークが「階層的構造」を持つことが明らかになりました。具体的には、ノード強度(そのキーワードと共起する他のキーワードの頻度の総和)の分布がべき乗分布(power-law distribution)に近い形を示しており、いわゆる「ロングテール」の形状を呈しています。これは、ほとんどのキーワードが少数のキーワードとしか結びついていない一方で、ごく一部のキーワードが多数のキーワードと高頻度で共起するハブ的な役割を担っていることを意味します。

ハブとして機能する代表的なキーワードは、「intelligent tutoring system(インテリジェント・チュータリング・システム)」「learning analytics(学習分析)」「massive open online course(大規模オープンオンラインコース)」「educational data mining(教育データマイニング)」「natural language processing(自然言語処理)」などです。なかでも「intelligent tutoring system」は、ネットワーク全体の中で最高のノード強度(747)を持ち、平均値(7.7)の約100倍という圧倒的な存在感を示しています。これは、この10年間においてAIEDという分野のほぼすべてのテーマが、インテリジェント・チュータリング・システムという概念と何らかの形でつながっていることを端的に物語っています。

また、ネットワークの密度は全体として低いにもかかわらず、加重クラスタリング係数の平均は高いという特性も確認されました。これは「まばらなのに密集している」という一見矛盾する特徴ですが、分野全体は疎につながりながらも、局所的には強くまとまった研究クラスターが形成されているという知識構造を示しています。日本の大学の研究室にたとえれば、全教員がすべての研究者と等しくつながっているわけではなく、専門分野ごとに強い結びつきを持つグループが形成されつつも、分野全体としては少数のスター研究者を介してゆるやかにつながっている、そのような構造に近いといえるでしょう。

メゾ分析が描く「知識の地図」―時代とともに変化するクラスター

メゾレベルの分析では、2年ごとの時間窓を設定した5期間(2010-11、2012-13、2014-15、2016-17、2018-19)のKCNに対して、コミュニティ検出アルゴリズムを適用し、各時期における知識クラスターの変遷が追跡されています。この時系列分析こそが、この研究の最も読み応えのある部分といえるかもしれません。

全期間を通じて「intelligent tutoring system」クラスターが常に巨大な存在感を持ち続けていたことは特筆に値します。これに加え、2014-15期を境に「massive open online course」クラスターが突如として大きな塊として出現し、それ以降も継続的な主要テーマとして定着している様子は、MOOCブームが現実のAIED研究にどれほどの影響を与えたかを如実に示しています。

また、「educational data mining」という大きなクラスターが2010-13期には独立して存在していたものの、その後は「affect(情動)」クラスター(2014-15)、「natural language processing」クラスター(2016-17)、「deep learning」クラスター(2018-19)へと吸収・統合されていく様子は、技術の進歩とともに研究の関心がどのように移り変わっていくかを視覚的に捉えた貴重な記録です。教育データマイニングが独自の領域として存在するのではなく、より新しい技術的概念の一部として再定義されていったという解釈は、分野の成熟と変容を象徴しているともいえます。

さらに、最終期(2018-19)において「eye tracking(視線追跡)」と「deep learning」が初めて独立したクラスターとして出現した事実も重要です。これらは新興テーマとして、今後AIEDの研究地図を塗り替える可能性を秘めた動向として注目されています。

ミクロ分析が特定する「トレンドキーワード」―何が次の主役になるか

ミクロレベルの分析では、ノード強度と加重媒介中心性(weighted betweenness centrality)という二つの指標を用いて、各キーワードのネットワーク上の役割が精査されています。媒介中心性とは、そのキーワードが異なるクラスター間を橋渡しする「ゲートキーパー」としての機能をどれだけ担っているかを示す指標です。

2018-19期において新たにトップ20に入ったキーワードとして、「collaborative problem solving(協調問題解決)」「neural network(ニューラルネットワーク)」「deep learning」「personalized learning(個別化学習)」「higher education(高等教育)」「ontology(オントロジー)」「eye tracking」の7つが挙げられています。これらがAIEDの今後の主要テーマとして有望視されているわけです。

特に注目すべきは「personalized learning」の台頭です。これはAIを活用して一人ひとりの学習者に最適化された学習体験を提供するという概念であり、日本の英語教育文脈においても「個別最適化学習」として近年強く打ち出されているテーマと完全に一致しています。文部科学省が掲げる「個別最適な学び」という方針とも軌を一にしており、AIED研究の動向が日本の政策論議と接続しうることを示す重要なエビデンスといえるでしょう。

日本の英語教育現場への示唆―何を学び、何を問うべきか

この研究が日本の英語教育関係者にとって持つ意味は、単に「世界のAIED研究がこんな状況です」という情報提供にとどまりません。より積極的な意義があります。まず、この研究が示す「natural language processing」の高い中心性は、英語のライティングやスピーキングの自動評価、文法チェック、フィードバック生成といった技術が、すでにAIED研究の中核に位置していることを意味します。日本の英語教育現場でも、AI搭載の英語学習アプリや自動採点システムの導入が進んでいますが、これらは世界のAIED研究と直結した技術的潮流の産物です。

次に、「collaborative learning」が全期間を通じてクラスターとして存在し続けていたことは、テクノロジーを活用した協調学習の設計が英語教育においても依然として重要なテーマであることを示しています。コミュニカティブ・アプローチを重視する英語教育の立場からすれば、AIが協調的なやり取りをどのように支援・分析・評価できるかという問いは、極めて実践的な関心事となるはずです。

また、「assessment(評価)」クラスターが継続的に存在していたことも注目に値します。自動採点、ピア評価支援、形成的フィードバックといったテーマは、英語のライティング指導において長年の課題であり続けており、AIによる解決策の模索がこの分野で活発に行われていることがネットワーク分析からも読み取れます。日本の高校・大学の英語教員が「AI採点はどこまで信頼できるか」という問いを持っているとすれば、その答えは世界のAIED研究の中にすでに積み上げられつつあるのです。

関連研究との対比―何が新しく、何が補完されるべきか

この研究の独自性は、Roll and Wylie(2016)やPinkwart(2016)といった先行レビュー研究と比較したとき、より鮮明になります。先行研究が少数の論文を質的に分析したレビューであるのに対し、FengとLawの研究は1830本という大規模なデータセットを対象としたデータ駆動型の分析であり、研究者個人の主観的な解釈に依存しない客観的な全体像の提示を試みています。これは方法論的に大きな前進です。

一方で、いくつかの限界も指摘できます。第一に、分析対象が5つの主要媒体に限定されており、AIEDに関連する研究が発表される他のコンピュータ科学系会議(例:NeurIPS、ACL、EDM以外のデータマイニング系会議)や一般教育学ジャーナルが含まれていない点は、データの代表性という観点から議論の余地があります。著者自身も結論部でこの点に言及し、UMAP(ユーザーモデリング・適応・パーソナライゼーション国際会議)やPALEといった関連媒体の包含を今後の課題として挙げています。

第二に、キーワード分析という性質上、各論文の「内容」ではなく「ラベル」を分析しているという根本的な制約があります。キーワードは著者が自ら付与するものであり、同じ研究内容でも著者によって異なるキーワードが選ばれる可能性があります。例えば「e-learning」「online learning」「distance learning」は概念的に重複しながらも異なるキーワードとして扱われており、これらを統合した分析が行われていれば、オンライン学習クラスターの規模はさらに大きくなった可能性があります。

第三に、この研究が対象とした2010-2019という時期は、ChatGPTをはじめとする大規模言語モデル(LLM)が本格的に教育現場に登場する直前の時代です。2022年以降のAIED研究は、生成AIの台頭によって大きな変容を遂げており、本論文が示すトレンドキーワードとして挙げられた「neural network」「deep learning」は、今や生成AIという概念の下に包含されつつあります。この論文が描いた「2019年までの地図」は、その後の急激な技術革新によって部分的に塗り替えられており、2020年代のAIED研究の全体像を把握するためには、同様の手法による後継研究が待望されます。

方法論的貢献の評価―三段階分析枠組みの汎用性

FengとLawが提案したマクロ・メゾ・ミクロという三段階の分析枠組みは、AIED以外の分野にも応用可能な汎用的なツールとして評価できます。実際、論文の結論部でも著者たちはこの枠組みの他分野への適用可能性を明示的に主張しています。日本の英語教育研究においても、例えば「第二言語習得研究」「英語教員養成研究」「CALL(コンピュータ支援言語学習)研究」などの領域で、同様のキーワード共起ネットワーク分析を行えば、各分野の知識構造と発展動向を可視化する有益な成果が得られるでしょう。

また、この研究が用いたモジュラリティ最適化によるコミュニティ検出(Clauset et al., 2004のfast greedy法)や、加重ベットウィーネス中心性の計算といった手法は、Rや Pythonといった統計・プログラミングツールを用いれば再現可能なものであり、研究者コミュニティにとって実践的な参照点となっています。分析の透明性と再現性という観点では、方法論の記述が詳細であり、高い評価に値します。

総合評価―AIED研究を「外から見る」試みの価値

総じて、この論文はAIED研究という急速に発展する分野を「内側から個別に研究する」のではなく「外側から全体を俯瞰する」という視点を提供した点で、学術的に高い意義を持ちます。研究者は往々にして自分の専門の木だけを見て森を見失いがちですが、このようなマクロな知識マッピング研究は、分野全体の構造と方向性を共有する場を提供してくれます。

日本の英語教育関係者にとってこの研究が持つ最大の価値は、「世界のAIED研究が10年間でどこに向かってきたか」を定量的・視覚的に示してくれる点にあります。個別化学習、自然言語処理、協調学習、評価の自動化―これらはいずれも日本の英語教育改革の文脈でも議論されているテーマであり、世界の研究動向を理解することは、日本独自の実践と研究を世界とつなぐための基盤となります。

2020年代に入り、生成AIが教育現場に急速に浸透しつつある今、FengとLawが描いた2010年代のAIED研究の「地図」は、私たちが今いる場所を確認し、次の一歩を踏み出すための基準点として機能し続けるでしょう。この研究が示した手法と知見は、AI時代の教育研究に携わるすべての研究者・実践者にとって、一度は目を通しておく価値のある貢献といえます。


Feng, S., & Law, N. (2021). Mapping artificial intelligence in education research: A network-based keyword analysis. International Journal of Artificial Intelligence in Education, 31(2), 277–303. https://doi.org/10.1007/s40593-021-00244-4

最新の研究の解説記事を見逃したくない方へ
膨大な論文の中から、読むべき重要研究を厳選し、わかりやすくまとめた記事を毎週土曜日に届けします。 忙しい先生のための情報収集ツールとしてお使いください。
icon

By 吉成 雄一郎

株式会社リンガポルタ代表取締役社長。東京電機大学教授、東海大学教授を経て現職。コロンビア大学大学院ティーチャーズカレッジ(英語教授法)、信州大学大学院工学研究科(情報工学)修了。専門は英語教授法、英語教育システム開発。 さまざまな英語学習書、英検、TOEIC 対策書、マルチメディア教材等を手がけてきた。英語eラーニングや英語関係の教材・コンテンツの研究開発も行う。全国の大学、短期大学、高専等で使われているeラーニングシステム「リンガポルタ」も開発した。最近ではAIによる新しい教育システムの開発にも着手している。

📖新刊情報|英語教育学海外論文解説: 海外の研究をサクッと解説』の最新号(第9号)が刊行されました!▶特集テーマ:EFLにおける批判的思考力の育成―最前線の研究レビュー

X
Amazon プライム対象