教育現場が抱える普遍的な課題

教室に30人の子どもがいれば、30通りの理解度と学習スタイルがあります。ある子は視覚的な説明を好み、別の子は実際に手を動かすことで理解が深まります。算数が得意でも国語が苦手な子もいれば、その逆もいます。しかし、一人の教師がすべての子どもに最適な教育を同時に提供することは、現実的にはほぼ不可能です。 この普遍的な課題に対して、人工知能(AI)技術を用いた個別化教育システムが一つの答えになるのではないかという期待が高まっています。本稿で取り上げるのは、韓国科学技術院(KAIST)のWoo-Hyun KimとJong-Hwan Kimが2020年に発表した研究論文”Individualized AI tutor based on developmental learning networks”です。この論文では、発達的学習ネットワーク(Developmental Learning Networks、略してDLNs)という仕組みを用いた個別化AI家庭教師システムが提案されています。

研究の背景―急成長する教育技術市場と韓国からの挑戦

筆者らによれば、教育技術(Edutech)産業は年間24%の成長率を示しており、2020年までに世界市場は2,520億ドル以上に達すると予測されていました。この背景には、最新技術の発展と、学習者の能力や移動性を考慮したカスタマイズ教育への需要があります。 Jong-Hwan Kimは、KAISTの電気工学部でロボット知能技術研究室を率いる教授であり、機械知能学習やAIロボットの分野で多数の著作を持つ研究者です。

一方、Woo-Hyun Kimは同大学で学士号と修士号を取得した後、この研究を博士課程の一環として進めていました。彼らの研究は、韓国政府の科学技術情報通信部(MSIT)が資金提供する「インテリジェント自律デジタルコンパニオンのための適応型機械学習技術開発研究」プロジェクトの一部として実施されました。 韓国は教育熱心な国として知られており、教育技術への投資も積極的です。この研究が韓国で行われたことは偶然ではないでしょう。研究者らは実際に商用化されたモバイルアプリケーションにこのAI家庭教師システムを組み込み、子どもたちに韓国語を教えるという実践的な場で検証を行いました。

脳の学習メカニズムに学ぶ―Adaptive Resonance Theoryの基礎

このシステムの基盤となっているのは、Adaptive Resonance Theory(適応共鳴理論、略してART)と呼ばれるニューラルネットワークです。ARTは1987年にGrosbergとCarpenterによって開発されたもので、人間の脳が新しい情報を学習する際のメカニズムからヒントを得ています。 私たちの脳は、新しいことを学ぶときに既存の知識をすべて忘れてしまうわけではありません。

例えば、犬という概念を知っている子どもが初めて猫を見たとき、「犬ではない何か新しい動物」として認識し、既存の犬についての知識は保持したまま、猫という新しいカテゴリーを形成します。ARTネットワークは、このような「新しいことを学びながらも古いことを忘れない」という特性を持っています。 従来のニューラルネットワークの多くは、新しいデータで訓練し直すと以前に学習した内容を上書きしてしまう「破局的忘却」という問題を抱えていました。しかし、ARTネットワークは増分学習(incremental learning)が可能であり、時間の経過とともに継続的に学習できるという利点があります。

既存のARTネットワークの限界

ARTネットワークには優れた特性がありますが、教育用AI家庭教師として使うには3つの大きな課題がありました。第一に、入力チャネルを後から追加できないという問題です。例えば、最初は学習者の成績と学習時間だけを記録していたシステムに、後から「集中力の持続時間」や「間違いのパターン」といった新しい情報を追加したくなることがあります。しかし、従来のARTネットワークでは、すべての入力チャネルを事前に定義しておく必要があり、途中で新しいチャネルを追加すると既存の分類が壊れてしまいます。

第二に、イベントの頻度を扱えないという問題です。従来のARTネットワークはイベントの時系列(順序)は扱えましたが、「ある活動を何回繰り返したか」という頻度の情報は記録できませんでした。学習者の好みを理解するには、順序だけでなく頻度も重要な情報です。例えば、パズルゲームを10回やった子どもと1回しかやっていない子どもでは、パズルへの好みが異なる可能性があります。

第三に、分類の柔軟性の問題です。教育効果は常に変動します。昨日まで効果的だった教材が、今日は効果が薄くなることもあります。このような変化を即座にシステムの分類に反映させる必要がありますが、従来のARTネットワークでは分類を拡大することはできても、縮小する(つまり、効果がなくなった教材を推薦リストから外す)ことが困難でした。

3つの学習ネットワークが支える個別化教育システム

筆者らが提案したシステムは、これら3つの課題に対応するため、3種類の発達的学習ネットワークを統合した構造になっています。それぞれのネットワークは異なる役割を担っています。 学習者状態DLN(Learner Status DLN) このネットワークは学習者の現在の学力状態を分類します。例えば、韓国語学習アプリであれば、母音の理解度、子音の理解度、二重母音の習得状況などを総合的に判断して、その学習者がどのレベルにいるかを把握します。 ここで重要なのが「入力チャネル追加アルゴリズム」です。このアルゴリズムの巧妙な点は、新しいチャネルを追加する際に、既存のチャネルと新しいチャネルを分けて処理する点にあります。 具体的には、まず既存のチャネルだけを使って、入力データがどのカテゴリーに属するかを判定します。

次に、そのカテゴリーに対して新しいチャネルのデータも適合するかをチェックします。もし適合すれば、そのカテゴリーの重みを更新します。適合しなければ、新しいカテゴリーを作成しますが、その際、既存チャネルの重みは元のカテゴリーから引き継ぎます。 これを家の増築に例えると分かりやすいかもしれません。既存の部屋の配置は維持したまま、新しい部屋を付け足すようなイメージです。既存の情報を壊さずに、新しい情報空間との関連付けを構築していくのです。 学習者好みDLN(Learner Preference DLN) このネットワークは学習者の学習スタイルや好みを分類します。ある子どもは聴覚的な学習を好み、別の子どもは視覚的なパズルを好むかもしれません。 ここで採用されているのが「イベントバンドル符号化アルゴリズム」です。

従来のDeep ARTネットワークでは、イベントの時系列は記録できましたが、同じイベントが何回発生したかという情報は失われていました。 このアルゴリズムでは、イベントの出力ベクトルを計算する際に、過去の出力を上書きせずに加算していきます。そして最後に、全体のイベント数で正規化します。これにより、「イベント1が5回、イベント2が3回発生した」という頻度情報を保持できるようになります。 さらに、このシステムは「n次のイベントバンドル」という概念を導入しています。1次のイベントバンドルは個々のイベントそのものですが、2次のイベントバンドルは連続する2つのイベントの組み合わせを表します。例えば、「パズルをやった後に聴覚ゲームをやる」という行動パターンです。これを拡張することで、より複雑な学習パターンを捉えることができます。

習者経験DLN(Learner Experience DLN) このネットワークは、過去の学習経験とその効果を記録します。同じ学習者に同じ教材を提供しても、時と場合によって効果は異なります。このネットワークは、どの状態の学習者にどの教材がどれだけ効果的だったかを記憶し、将来の推薦に活かします。 ここで使われている「代替テンプレート学習アルゴリズム」が特徴的です。各カテゴリーには、一つの基本的な重みベクトルではなく、「高効果テンプレート」と「低効果テンプレート」の2つのテンプレートが用意されています。 高効果の学習コンテンツが入力されると、高効果テンプレートはそのコンテンツを含むように拡大し、低効果テンプレートはそのコンテンツを除外するように縮小します。逆に、低効果のコンテンツが入力されると、逆の操作が行われます。 これは、良い経験と悪い経験を明確に区別して記憶する人間の記憶システムに似ています。「このレストランの料理は美味しかった」という記憶と「ここの料理は口に合わなかった」という記憶を、同時に、しかし別々に保持するようなものです。

実際の教育現場での検証―30,000人が使う韓国語学習アプリ

研究チームは、このシステムを実際の商用モバイルアプリケーションに実装しました。このアプリは子どもたちに韓国語を教えるもので、2018年10月からApple App StoreとGoogle Play Storeで提供されています。2019年3月にはApple App Storeで特集され、その後iPadキッズアプリカテゴリーでトップランクを維持しています。 アプリには30以上の教育ゲームが含まれており、総ユーザー数は30,000人以上、毎日500人のユーザーが利用しています。

収集された学習データの総数は500万件以上に上ります。 実験では、このうち利用頻度の高い1,000人のユーザーから得られた80万件のデータを使ってAI家庭教師を訓練しました。データベースには、ユーザーID、学習期間、学習目標(母音、子音、二重子音、二重母音、終声子音の5つのカテゴリー)、教育ゲーム(8種類のゲームカテゴリー)、達成度スコアなどが含まれています。 興味深いのは、システムの性能を評価するために、15年の経験を持つ韓国語教育の専門家が開発し、さらに10年以上の経験を持つ3人の専門家がレビューした標準カリキュラムと比較している点です。 結果は印象的でした。

AI家庭教師が推薦した学習コンテンツは、各学習期間において標準カリキュラムが提案する内容をすべて含んでいました。さらに、カリキュラムではカバーされていない追加の学習コンテンツも提案していました。これは、AI家庭教師が標準的な教育プランと同等以上の推薦を行えることを示しています。 また、学習目標の推薦に関しても、学習者の弱点を適切に把握して推薦していることが確認されました。例えば、母音が苦手な学習者には母音の学習を優先的に推薦し、学習が進むにつれて、初期段階では基礎的な内容(母音、子音、二重子音)を多く推薦し、後期段階ではより難しい内容(二重母音、終声子音)を推薦するという、

教育的に妥当な推薦パターンを示しました。 学習活動の推薦についても、学習者の好みを反映した推薦が行われていることが確認されました。8種類の異なる教育ゲーム(聞く、探す、パズル、風船を膨らませる、恐竜と遊ぶ、パチンコ、ケーキを焼く、洗濯をする)の中から、各学習者が好むゲームを優先的に推薦していました。

シミュレーション実験が示す技術的な有効性

研究チームは、実際のアプリでの検証に加えて、各アルゴリズムの有効性を確認するためのシミュレーション実験も実施しています。 入力チャネル追加アルゴリズムの実験では、平均と分散の組み合わせによって50のグループを作り、各グループに200個の入力データを用意しました。最初は2つのチャネルだけで学習を開始し、途中で新しいチャネルを追加しました。 従来の手法では、新しいチャネルが追加されると、もともと別々のカテゴリーに属していた入力が同じカテゴリーに統合されてしまい、一部のテンプレートが縮小するという問題が発生しました。

これに対して、提案手法では、元の分類を維持したまま、新しいチャネルに関する情報を追加することができました。精度の評価でも、特にデータの分散が大きい難しい条件下でも、提案手法の方が高い精度を示しました。 イベントバンドル符号化アルゴリズムの実験では、10種類のイベントタイプを含む20個のイベントからなるシーケンスを合成しました。1次のイベントバンドルの実験では、特定のイベント(イベント1)が1回、2回、4回、8回、16回含まれる条件で100個のシーケンスを生成しました。 結果は明確でした。イベントバンドル符号化では、イベント1の出現回数に比例して符号化ベクトルの該当要素の値が増加しましたが、従来の時系列符号化では出現回数と符号化値に関連性が見られませんでした。2次のイベントバンドルの実験でも同様の結果が得られ、連続する2つのイベントの組み合わせの頻度を正確に記録できることが示されました。

研究の意義と限界

この研究の最大の貢献は、理論的な提案にとどまらず、実際の商用アプリケーションに実装し、数万人のユーザーによる実証実験を行った点にあります。教育AI研究の多くは実験室環境での検証にとどまることが多い中、これは貴重な試みと言えます。 技術的には、ARTネットワークの3つの重要な限界を克服する具体的なアルゴリズムを提案し、シミュレーションと実アプリケーションの両方で有効性を示しました。特に、入力チャネルを動的に追加できる仕組みは、長期的に運用される教育システムにとって実用的な価値が高いでしょう。 ただし、論文にはいくつかの限界も認められます。

まず、評価方法について、標準カリキュラムとの比較は行われていますが、実際の学習効果(例えば、AI家庭教師を使った子どもと使わない子どもで、学習成果にどれだけ差が出るか)の長期的な検証は行われていません。論文の最後で筆者らも「今後の研究として、AI家庭教師と学習者の相互作用から個別の学習データを収集し、長期的な教育の効果を測定する」と述べています。 また、システムが推薦する学習コンテンツの多様性についても疑問が残ります。

標準カリキュラムよりも多くのコンテンツを推薦しているとはいえ、それが学習者にとって本当に最適なのか、あるいは単に選択肢が増えすぎて混乱を招く可能性はないのか、といった点は検討されていません。 プライバシーとデータセキュリティについての言及も限定的です。子どもたちの学習データを大量に収集・分析するシステムである以上、データの保護やプライバシーへの配慮は重要な課題ですが、この論文ではほとんど触れられていません。 システムの汎用性も課題でしょう。この研究は韓国語学習という特定の領域で検証されていますが、数学や科学など他の教科にも適用できるかどうかは明らかではありません。韓国語学習は比較的構造化されており、明確な学習段階(母音、子音など)がありますが、より抽象的な概念を扱う教科では異なるアプローチが必要かもしれません。

今後の展望と教育への示唆

それでも、この研究が示唆するところは大きいと言えます。教育の個別化は、教育者が長年追い求めてきた理想です。一人ひとりの子どもに最適な教育を提供することができれば、学習効果は大きく向上するでしょう。しかし、現実の教室では、一人の教師が多数の生徒を同時に教えなければならず、個別対応には限界があります。 AI技術は、この長年の課題に対する一つの解決策を提供する可能性があります。

ただし、AIが教師に取って代わるというよりも、教師を支援するツールとして機能することが重要でしょう。AIシステムは、各生徒の理解度や好みを継続的に追跡し、適切な学習教材を提案することができます。そして教師は、AIが提供する情報を参考にしながら、より深い人間的な関わりや、創造的な学習活動の設計に時間を使うことができます。 筆者らのシステムが興味深いのは、単に「この子どもは何が苦手か」を判定するだけでなく、「この子どもはどんな学習スタイルを好むか」も考慮している点です。同じ内容を学ぶにしても、視覚的なパズルで学ぶのが好きな子もいれば、聴覚的なゲームが好きな子もいます。学習内容だけでなく、学習方法も個別化することで、子どもたちの学習意欲を維持しやすくなるでしょう。

また、システムが学習経験から継続的に学び、適応していく点も重要です。教育は静的なものではありません。子どもは成長し、興味や能力は変化します。同じ教材でも、時期によって効果が異なることがあります。このような変化に対応できる柔軟なシステムの設計は、長期的な教育支援にとって不可欠です。 データ駆動型の教育システムが普及するにつれて、私たちは教育に関する新しい知見を得られる可能性もあります。何万人もの子どもたちの学習パターンを分析することで、効果的な教育方法についての一般的な法則が見つかるかもしれません。あるいは、これまで気づかれていなかった学習の困難さのパターンが明らかになるかもしれません。

おわりに

Woo-Hyun KimとJong-Hwan Kimの研究は、機械学習の理論的な発展と実践的な教育応用を結びつけた意欲的な試みです。Adaptive Resonance Theoryという神経科学に着想を得た理論を基盤に、教育現場の具体的なニーズに応える3つのアルゴリズムを開発し、実際に30,000人以上が使用する商用アプリケーションで検証しました。 この研究から得られる最も重要な教訓は、AIによる個別化教育が単なる理論上の可能性ではなく、現実に実装可能な技術であるということでしょう。

もちろん、まだ改善の余地は多くあります。学習効果の長期的な検証、他の教科への適用、プライバシーへの配慮など、取り組むべき課題は少なくありません。 しかし、教育という人類にとって最も重要な営みの一つに、最新の技術を適用しようとする試みは、間違いなく価値のあることです。すべての子どもが自分のペースで、自分に合った方法で学べる環境を作ること。それは、技術の力を借りることで、少しずつ現実に近づいているのかもしれません。

韓国のKAISTから発信されたこの研究が、世界中の教育技術研究者や実践者にとって、一つの重要な参照点となることは間違いないでしょう。そして何より、このシステムを実際に使っている子どもたちが、より楽しく、より効果的に学べているのであれば、それが研究の最大の成果と言えるのではないでしょうか。


Kim, W.-H., & Kim, J.-H. (2020). Individualized AI tutor based on developmental learning networks. IEEE Access, 8, 27927–27937. https://doi.org/10.1109/ACCESS.2020.2972167

By 吉成 雄一郎

株式会社リンガポルタ代表取締役社長。東京電機大学教授、東海大学教授を経て現職。コロンビア大学大学院ティーチャーズカレッジ(英語教授法)、信州大学大学院工学研究科(情報工学)修了。専門は英語教授法、英語教育システム開発。 さまざまな英語学習書、英検、TOEIC 対策書、マルチメディア教材等を手がけてきた。英語e ラーニングや英語関係の教材・コンテンツの研究開発も行う。全国の大学、短期大学、高専等で使われているe ラーニングシステム「リンガポルタ」も開発した。最近ではAI による新しい教育システムの開発にも着手している。

Amazon プライム対象