研究の背景と著者について
近年、人工知能技術の急速な発展により、教育分野においても大きな変化が起こっています。特にChatGPTをはじめとする大規模言語モデルの登場は、外国語教育の在り方に新たな可能性をもたらしています。今回取り上げる論文”AI‑powered language learning: Developing the chatGPT usage scale for foreign language learners”は、このような技術的変化を背景として、外国語学習者のChatGPT使用状況を測定する尺度の開発を目指した研究です。
この研究を実施したのは、トルコのガジ大学教育学部で外国語教育を専門とする2名の研究者です。第一著者のFerdiye ÇOBANOĞULLARIはドイツ語教育を、第二著者のÖzge ÖZBEKはフランス語教育を専門としています。両氏とも外国語教育分野での豊富な経験を持ち、特に技術支援言語学習に関心を寄せている研究者として知られています。
研究が行われたトルコは、多言語教育が盛んな国であり、英語、ドイツ語、フランス語、アラビア語など多様な外国語教育が大学レベルで提供されています。このような多言語環境で実施された研究であることは、結果の一般化可能性を考える上で重要な要素となります。
研究の目的と意義
この研究の主要な目的は、外国語学習者のChatGPT使用状況を体系的に測定できる信頼性と妥当性のある尺度を開発することでした。研究者らが指摘するように、ChatGPTが外国語教育に与える影響について多くの研究が行われているものの、学習者の実際の使用状況を定量的に測定する標準化された道具は存在していませんでした。
この尺度開発の意義は複数の観点から理解できます。まず、教育政策の観点からは、AI技術の教育への統合を検討する際の客観的な評価基準を提供します。教育機関がChatGPTなどのAI技術を導入する際、学習者の使用状況や効果を測定する標準化された方法があることは、意思決定の質を向上させることにつながります。
次に、教育実践の観点からは、教員が学習者のAI活用状況を把握し、適切な指導を行うための手がかりを提供します。従来の外国語教育では、学習者の学習方略や動機を測定する様々な尺度が開発されてきましたが、AI技術の使用に特化した尺度はありませんでした。この研究は、そうした空白を埋める重要な貢献をしています。
研究方法の検証
この研究では、尺度開発の標準的な手順が丁寧に実行されています。まず、文献レビューに基づいて30項目の予備項目を作成し、10名の専門家による内容妥当性の検証を行いました。専門家の構成は、外国語教育の専門家5名、測定・評価の専門家2名、コンピュータ・教育技術の専門家3名となっており、多角的な視点からの評価が行われました。
その後、32名の学生を対象とした予備調査を実施し、項目の理解可能性を確認した上で、3つの国立大学の1,006名の外国語学科学生を対象とした本調査を実施しました。この規模の調査は、尺度開発研究としては十分な標本数を確保していると言えます。
統計的分析については、探索的因子分析と確認的因子分析の両方を実施し、信頼性についてはクロンバックのα係数とテスト-再テスト法の両方で検証しています。これらの方法論は、心理測定学の標準的な手順に沿っており、研究の信頼性を支える重要な要素となっています。
ただし、いくつかの方法論上の課題も指摘できます。まず、調査対象者の選定について、研究者らは「ランダムに選択した」と述べていますが、具体的な抽出方法についての詳細な記述がありません。また、3つの大学がどのような基準で選ばれたのかについても明確な説明がないため、標本の代表性について疑問が残ります。
研究結果の評価
研究の結果として、18項目から構成される3因子構造の尺度が開発されました。3つの因子は「ユーザビリティ」「学習」「発達」と名付けられ、全体の分散の62.896%を説明しています。この説明率は多因子尺度としては十分な水準にあります。
「ユーザビリティ」因子は、ChatGPTの一般的な使いやすさや使用頻度を測定する項目で構成されています。「学習」因子は、新しい知識の習得や試験勉強など、直接的な学習活動におけるChatGPTの使用を測定します。「発達」因子は、創造性や批判的思考力の向上など、従来の学習活動を超えた能力開発におけるChatGPTの活用を評価します。
この因子構造は理論的にも妥当であり、ChatGPTの多面的な活用方法を適切に捉えていると評価できます。特に「発達」因子が分散の最も大きな部分(46.022%)を説明していることは興味深い結果です。これは、学習者がChatGPTを単純な情報検索ツールとしてだけでなく、より高次の認知スキル向上のために活用している可能性を示唆しています。
信頼性についても、全体のクロンバックのα係数が0.93と高い値を示しており、各下位尺度についても0.84から0.89の範囲で良好な内的一貫性が確認されています。テスト-再テスト信頼性についても、ピアソンの相関係数0.82という高い安定性が示されました。
研究の限界と問題点
この研究にはいくつかの重要な限界があります。まず、最も大きな問題は、調査対象がトルコの3つの国立大学の学生に限定されていることです。研究者自身も認めているように、この結果を他の文化的背景や教育制度を持つ国に一般化できるかは不明です。特に、AI技術への態度や利用可能性は国や地域によって大きく異なる可能性があります。
次に、調査時期の問題があります。この調査は2023-2024年の秋学期に実施されましたが、AI技術の発展スピードを考慮すると、わずか数か月でもChatGPTの機能や学習者の使用パターンが大きく変化している可能性があります。研究者らもこの点について言及していますが、技術の急速な変化に対応した継続的な尺度の更新が必要になるでしょう。
また、調査対象者の選定基準についても課題があります。研究では「ChatGPTを複数回使用したことがある学生」を対象としていますが、使用経験の具体的な定義や確認方法について詳細な記述がありません。これにより、回答者間でChatGPTの使用経験に大きなばらつきがある可能性があります。
さらに、この尺度が測定しているのはあくまで学習者の自己報告による使用状況であり、実際の使用行動や学習効果との関連は検証されていません。尺度の得点が高い学習者が実際により効果的にChatGPTを活用しているかどうかは別途検証が必要です。
批判的検討と課題
この研究のもう一つの重要な課題は、ChatGPTの使用に関する倫理的・教育的な側面への配慮が十分でないことです。論文中では、ChatGPTが試験において不正行為の手段として使用される危険性について言及されていますが、この尺度自体がそのような問題的な使用を識別したり防止したりする機能は持っていません。
また、ChatGPTの使用が外国語学習に与える長期的な影響について、この尺度だけでは評価できません。例えば、ChatGPTに過度に依存することで、学習者の自律的な言語能力の発達が阻害される可能性についても考慮が必要です。
研究の理論的基盤についても検討が必要です。この研究では、主に技術受容モデル(Technology Acceptance Model)や自己調整学習理論などの既存の理論が参照されていますが、AI技術の特殊性を考慮した新たな理論的枠組みの必要性についてはあまり議論されていません。
統計的分析についても、いくつかの課題があります。確認的因子分析の結果、CMIN/df値が5.542と基準値(5以下)をわずかに上回っており、研究者らはこれを大きな標本サイズによるものと説明していますが、より慎重な解釈が必要かもしれません。
今後の発展可能性
この研究が提供した尺度は、外国語教育におけるAI技術活用研究の重要な第一歩として評価できます。しかし、真に有用な測定道具とするためには、さらなる発展が必要です。
まず、文化的多様性を考慮した国際的な妥当性検証が不可欠です。異なる国や文化圏での尺度の適用可能性を検証し、必要に応じて文化特有の項目の追加や修正を行うべきでしょう。特に、アジア圏やヨーロッパ、北米など、教育制度や技術環境が異なる地域での検証が重要です。
次に、縦断的研究による予測妥当性の検証が必要です。この尺度による測定結果が、実際の学習成果や言語能力の向上とどの程度関連しているかを長期的に追跡調査することで、尺度の実用性を高めることができます。
また、他の測定方法との併用による三角測量(トライアンギュレーション)も重要です。自己報告による尺度だけでなく、行動ログ分析や観察法、インタビューなどの質的手法と組み合わせることで、より包括的な理解が可能になるでしょう。
教育実践への応用を考えると、この尺度を基にした診断的評価ツールの開発も期待されます。学習者のChatGPT使用パターンを分析し、より効果的な活用方法を提案したり、問題的な使用を早期に発見したりするシステムの構築が可能かもしれません。
まとめ
この研究は、急速に変化するAI時代の外国語教育において、重要な測定道具を提供した価値ある研究です。堅実な方法論に基づいて開発された尺度は、今後の関連研究の基盤となる可能性を秘めています。
しかし同時に、文化的一般化可能性の限界、技術変化への対応、倫理的考慮の不足など、いくつかの重要な課題も明らかになりました。これらの課題は、AI技術を教育に統合する際に避けて通れない根本的な問題を反映しています。
今後、この分野の研究がさらに発展するためには、技術的な側面だけでなく、教育哲学や学習理論の観点からもAI活用について深く考察することが必要です。また、学習者の多様性や個別性を尊重し、AI技術が真に教育の質向上に貢献できるような研究と実践の蓄積が求められています。
この研究が提起した問題意識と開発した測定道具は、そうした包括的な取り組みの出発点として重要な意義を持っています。今後の継続的な研究により、より精緻で実用的な評価方法が確立されることを期待したいと思います。
Çobanoğullari, F., & Özbek, Ö. (2025). AI‑powered language learning: Developing the chatGPT usage scale for foreign language learners. Education and Information Technologies, 30, 12517–12534. https://doi.org/10.1007/s10639-025-13342-w