はじめに―研究の背景と筆者たち

Alaa Aladini氏(オマーンのDhofar大学)、Sayed M. Ismail氏(サウジアラビアのPrince Sattam bin Abdulaziz大学)、Mohamad Ahmad Saleem Khasawneh氏(サウジアラビアのKing Khalid大学)、Goodarz Shakibaei氏(イランのIslamic Azad大学)による本研究は、2024年12月に『Computers in Human Behavior Reports』誌に掲載されました。この論文”Self-directed writing development across computer/AI-based tasks: Unraveling the traces on L2 writing outcomes, growth mindfulness, and grammatical knowledge”は、生成AI技術が教育現場に急速に浸透している現在、その効果を実証的に検証しようとする意欲的な試みです。

研究チームは中東の複数の大学に所属しており、特にイランの英語教育現場という、日本とは異なる文化的・教育的背景を持つ環境での調査です。しかし、だからこそ、その知見は普遍性を持つ可能性があります。教室で先生が一方的に教え、生徒がノートを取るという伝統的な授業風景は、世界中どこでも見られるものでしょう。そこにAIという新しい要素が加わったとき、学習はどう変わるのか―この問いは、日本の英語教育にとっても極めて重要です。

研究の核心―何を、どのように調べたのか

この研究の規模はかなり大きなものです。イランのAhvazという都市にある3つの私立英語学校で、561名もの中級レベルのEFL学習者が参加しました。実験群276名、対照群285名という数字は、語学教育研究としては相当な規模です。多くの研究が数十名程度の参加者で行われることを考えると、この点だけでも注目に値します。

実験群の学習者たちは、20セッションにわたってAIツールを使った自己主導型ライティングタスクに取り組みました。具体的には、ChatGPTなどのAIプラットフォームを使って作文の下書きを作成し、修正を重ね、フィードバックを受けるというプロセスです。一方、対照群は従来型の教師主導の授業を受けました。ブレインストーミング、アウトライン作成、段落構成といった基本を教師から学び、教師からのフィードバックを受けるという、私たちが慣れ親しんだ方法です。

測定には3つの側面がありました。まず40問の多肢選択式文法テストで文法知識を測定し、200~250語の作文課題でライティング能力を評価しました。さらに興味深いのは、Mindful Attention Awareness Scale(MAAS)という15項目の尺度を使ってマインドフルネス―つまり、今この瞬間に意識的に注意を向ける能力―を測定したことです。これは単なる語学力の測定を超えて、学習者の内面的な成長にも目を向けようとする姿勢の表れです。

結果が語るもの―数字の背後にある物語

事前テストでは、両群の間に有意な差は見られませんでした。つまり、スタート地点は同じだったのです。ところが20セッション後、状況は一変しました。実験群は文法テストで平均25.80点(対照群は20.81点)、ライティングテストで18.91点(対照群は14.95点)、マインドフルネス尺度で52.78点(対照群は48.95点)を記録しました。統計的にも有意な差が認められ、3つの研究仮説すべてが棄却されました。

この数字が意味するのは何でしょうか。私自身、英語を学習してきた経験から言えば、ライティング能力の向上というのは非常に実感しづらいものです。文法ミスが減ったとか、表現の幅が広がったとか、そういう変化は自分ではなかなか気づけません。ところがAIによる即時フィードバックがあると、自分の成長が目に見える形になります。「前回はこういうミスをしたけど、今回は直せた」という小さな成功体験の積み重ねが、学習者の自信につながっていくのでしょう。

さらに注目すべきは、マインドフルネスの向上です。これは単に「集中力が高まった」という以上の意味を持ちます。自分の学習プロセスに意識的になり、自分で目標を設定し、進捗を振り返る―そういうメタ認知的なスキルが育まれたということです。ある学習者はインタビューで「自分のペースで進められたことで、自分の弱点に集中できた」と語っています。別の学習者は「AIからのフィードバックを評価して、何が自分に合うか決める必要があった」と述べ、批判的思考の成長を示唆しています。

理論との対話―なぜこのような結果になったのか

研究チームは、この結果を複数の学習理論で説明しています。まず構成主義学習理論です。PiagetやVygotskyが唱えたように、学習者は受動的に知識を吸収するのではなく、能動的に知識を構築していきます。AIを使った学習では、学習者は常に自分の文章と向き合い、フィードバックを解釈し、修正を重ねるという能動的なプロセスに関わります。これがまさに構成主義的な学習だというわけです。

次に自己調整学習理論(Schunk & Zimmerman)です。実験群の学習者たちは、自分で学習目標を設定し、進捗をモニタリングし、戦略を調整していました。インタビューからは「AIリマインダーのおかげで目標を忘れずにいられた」「タイマーを使って集中できた」といった時間管理の工夫や、「弱点に気づいて対策できた」という自己評価の様子がうかがえます。

Vygotskyの最近接発達領域(ZPD)の概念も重要です。AIは適切な足場かけ(scaffolding)を提供し、学習者が現在の能力を少し超えた課題に取り組めるよう支援します。個別化されたフィードバックや段階的な課題設定がまさにこれに当たります。

認知負荷理論(Sweller)の観点からは、AIが文法チェックや剽窃検出などの低次の作業を自動化することで、学習者は内容の構成や論理展開といった高次の思考に認知資源を割けるようになったと説明できます。ある学習者が「AIのおかげで細かいミスに気を取られず、アイデアの発展に集中できた」と語っているのは、この理論を裏付けています。

そして自己決定理論(Deci & Ryan)です。学習者が自律性、有能感、関係性という3つの基本的欲求を満たすとき、内発的動機づけが高まります。AI支援学習では、学習者は自分のペースで進められる(自律性)、即時フィードバックで成長を実感できる(有能感)、ピアレビューで仲間とつながれる(関係性)という環境が整っていました。

日本の教育現場への示唆―私たちは何を学べるか

この研究から日本の英語教育が学べることは多々あります。まず、AI導入の効果が実証されたことです。日本でもChatGPTなどのAIツールの教育利用が議論されていますが、「使わせたら生徒が考えなくなるのでは」という懸念の声もあります。しかしこの研究は、適切に設計されたAI支援学習が、むしろ批判的思考やメタ認知を促進することを示しています。

ただし、日本の教育現場には独自の課題もあります。イランの私立英語学校と日本の公立中学・高校では、クラスサイズ、設備、教師の負担、入試制度など、あらゆる条件が異なります。この研究では561名を20クラスに分けていますが、日本では1クラス40名が当たり前という状況もあります。そうした環境でAI支援学習をどう実装するかは、別途検討が必要でしょう。

興味深いのは、マインドフルネスの向上という結果です。日本の英語教育では、TOEIC対策や入試対策といった外発的動機づけが強調されがちですが、この研究は学習者の内面的成長にも目を向けています。自分の学習プロセスに意識的になり、自己調整できる学習者を育てることは、長期的には英語力の向上にもつながるはずです。

また、自律性の重視も重要です。日本の英語授業では、教師が主導権を握り、生徒は受動的に従うというパターンが根強く残っています。しかしこの研究の学習者たちは「自分でトピックを選べた」「自分のペースで進められた」ことに大きな価値を見出しています。AIは教師の代替ではなく、学習者の自律性を支える道具として機能しうるのです。

批判的考察―この研究の限界と今後の課題

しかし、この研究には限界もあります。まず、サンプリングの問題です。研究チームも認めているように、便宜的サンプリング(convenience sampling)が用いられており、一般化可能性には疑問が残ります。私立英語学校に通う、比較的裕福で学習意欲の高い層が対象であり、公立学校の生徒や学習困難を抱える生徒にも同様の効果があるかは不明です。

また、20セッションという期間は、長期的効果を測るには短すぎるかもしれません。AI支援学習の効果は持続するのか、学習者はAIへの過度の依存を避けられるのか、こうした問いには答えられていません。研究チームが「今後の研究課題」として縦断的研究を挙げているのはもっともです。

技術的な制約も重要です。この研究が行われた2024年時点では、ChatGPTなどのAIツールはかなり高度になっていましたが、それでも誤った情報を提供することがあります(いわゆる「ハルシネーション」)。学習者がAIの出力を批判的に評価できるようになるには、一定のリテラシー教育が必要でしょう。

さらに、文化的要因も考慮すべきです。イランと日本では、教育観、師弟関係、失敗への態度などが大きく異なります。イランの学習者が「楽しかった」と感じたAI支援タスクが、日本の学習者にも同じように受け入れられるとは限りません。異文化間比較研究が待たれます。

定量的分析についても疑問があります。データが正規分布していなかったためMann-Whitney U検定という非パラメトリック検定が用いられましたが、これは統計的検出力が若干低くなります。また、インタビュー対象者が33名と限られており、質的データの飽和が本当に達成されたのかは検証が必要です。

関連研究との対話―この研究はどこに位置づけられるか

本研究は、AI支援言語学習の研究潮流の中に位置づけられます。Wiboolyasarin et al.(2024)は、Wikiベースの協働ライティングにChatGPTのフィードバックを組み込んだ研究で、本研究と類似の結果を得ています。Zhang et al.(2023)は、チャットボットが論理的誤謬の理解を助ける一方で自己効力感を下げたと報告しており、AI支援学習の複雑さを示しています。

Wei(2023)やXu & Wang(2024c)のメタ分析は、AI支援学習の効果を大規模に検証しており、本研究の結果と整合しています。しかし、これらの先行研究の多くは短期間・小規模なものであり、本研究のような561名・20セッションという規模は珍しいと言えます。

一方、Lin(2023)やMogavi et al.(2024)は、AI依存や批判的思考の低下といった負の側面も指摘しています。本研究ではこうした負の効果はあまり報告されていませんが、それは研究デザインや測定方法に起因するかもしれません。学習者の自己報告に頼った質的データは、社会的望ましさバイアスの影響を受けやすいからです。

日本の文脈では、Mohamed et al.(2024)の国際比較研究が示唆的です。AI支援学習の効果は国籍や専攻によって異なり、文化的要因が重要であることが分かっています。本研究の知見を日本の教育現場に適用する際には、こうした文化的差異を念頭に置く必要があります。

教育実践への含意―教師の役割はどう変わるのか

この研究が示唆するのは、AIは教師に取って代わるものではなく、教師の役割を変容させるものだということです。AIが文法チェックや基本的フィードバックを担当すれば、教師はより高次の指導―たとえば創造性の育成、批判的思考の促進、個別カウンセリング―に時間を割けるようになります。

ある意味で、これは教師にとって脅威ではなく機会です。採点や添削といった時間のかかる作業から解放されることで、一人ひとりの学習者と向き合う時間が増えます。インタビューで学習者たちが「ピアレビューが有益だった」と述べているように、AIは協働学習を促進する触媒にもなりえます。教師は学習のファシリテーターとして、そうした協働をデザインし支援する役割を担うのです。

ただし、これには教師自身のAIリテラシー向上が不可欠です。どのAIツールが信頼できるのか、どう使えば効果的なのか、学習者の過度な依存をどう防ぐのか―こうした知識とスキルを教師が身につける必要があります。日本でも教師研修プログラムの見直しが求められるでしょう。

カリキュラム開発への示唆―どんな学習環境を作るべきか

カリキュラム開発者にとって、この研究は重要な示唆を含んでいます。AI支援学習を単なる「おまけ」ではなく、カリキュラムの中核に据えることが求められます。しかし同時に、AIに全面的に依存するのではなく、従来型の教師主導型指導とのバランスを取ることも重要です。

研究チームが強調するように、AIツールは個別化学習を可能にします。学習者一人ひとりの習熟度、興味、学習スタイルに合わせてカスタマイズされた学習経験を提供できるのです。これは日本の画一的な英語教育への強力なアンチテーゼになりえます。

また、メタ認知スキルの育成もカリキュラムに組み込むべきです。単にAIツールを使わせるだけでなく、自己評価、目標設定、学習戦略の選択といったメタ認知的活動を明示的に教える必要があります。本研究の学習者たちが示したような自己調整能力は、自然に身につくものではなく、意図的な指導を通じて育まれるものだからです。

倫理的考察―見過ごされがちな問題

この論文では十分に論じられていませんが、AI支援学習には倫理的な問題もあります。まず、データプライバシーの問題です。学習者がAIツールに入力した作文は、どこに保存され、誰がアクセスでき、どう利用されるのでしょうか。特に未成年者の場合、保護者の同意だけで十分なのか、慎重な検討が必要です。

また、公平性の問題もあります。高価なAIツールを使える裕福な層と、そうでない層との間で、学習機会の格差が広がる可能性があります。日本でも、私立校と公立校、都市部と地方との間でデジタルデバイドが存在します。AI支援学習の普及は、こうした格差を縮小するどころか、拡大させかねません。

さらに、学術的誠実性の問題もあります。AIを使った作文は、どこまでが学習者自身の成果と言えるのでしょうか。本研究では「AI支援」と表現されていますが、その境界は曖昧です。評価の公正性を保つためには、明確なガイドラインが必要です。

未来への問い―次に何を研究すべきか

研究チームは今後の研究課題として8点を挙げていますが、私からはさらにいくつか提案したいと思います。まず、異なる習熟度レベルでの効果の比較です。本研究は中級レベルに限定されていましたが、初級者や上級者ではどうなのか、調べる価値があります。

また、異なるタイプのAIツールの比較も重要です。ChatGPT、Google Gemini、Claude AIなど、さまざまな生成AIツールが利用可能ですが、それぞれ特性が異なります。どのツールがどの学習目的に適しているのか、体系的な比較研究が必要です。

さらに、学習者のタイプによる差異も探るべきです。内向的な学習者と外向的な学習者、視覚型学習者と聴覚型学習者では、AI支援学習への反応が異なるかもしれません。個人差を考慮したきめ細かい研究が求められます。

最後に、長期的な追跡調査も不可欠です。AI支援学習で身につけたスキルは、数年後も維持されるのでしょうか。それとも、AIなしでは書けなくなってしまうのでしょうか。こうした問いに答えるには、縦断的な研究デザインが必要です。

結びに―技術と人間性のバランス

この研究が私たちに問いかけているのは、技術と人間性のバランスです。AIは強力なツールですが、それ自体が目的ではありません。大切なのは、AIを使って何を達成したいのか、どんな学習者を育てたいのかという問いです。

本研究の学習者たちは、文法知識やライティングスキルだけでなく、マインドフルネスや自己調整能力といった人間的な資質も伸ばしました。これは、AI支援学習が適切に設計されれば、技術的スキルと人間的成長を両立できることを示唆しています。

日本の英語教育も、この知見から学べることは多いでしょう。入試対策や資格試験のスコアアップばかりに目を向けるのではなく、学習者の内面的成長、自律性、批判的思考を育むこと―そうした本質的な教育目標を、AI支援学習を通じて追求できるかもしれません。

技術は日々進化し、教育のあり方も変わり続けます。しかし変わらないのは、学習者一人ひとりの成長を支えたいという教育者の願いです。AIという新しい道具を手に入れた今、私たちは改めて問わなければなりません―良い教育とは何か、良い学習とは何か、そして良い学習者とはどんな人なのかと。この研究は、そうした根本的な問いへの一つの答えを示してくれています。


Aladini, A., Ismail, S. M., Khasawneh, M. A. S., & Shakibaei, G. (2025). Self-directed writing development across computer/AI-based tasks: Unraveling the traces on L2 writing outcomes, growth mindfulness, and grammatical knowledge. Computers in Human Behavior Reports, 17, Article 100566. https://doi.org/10.1016/j.chbr.2024.100566

 

By 吉成 雄一郎

株式会社リンガポルタ代表取締役社長。東京電機大学教授、東海大学教授を経て現職。コロンビア大学大学院ティーチャーズカレッジ(英語教授法)、信州大学大学院工学研究科(情報工学)修了。専門は英語教授法、英語教育システム開発。 さまざまな英語学習書、英検、TOEIC 対策書、マルチメディア教材等を手がけてきた。英語eラーニングや英語関係の教材・コンテンツの研究開発も行う。全国の大学、短期大学、高専等で使われているeラーニングシステム「リンガポルタ」も開発した。最近ではAIによる新しい教育システムの開発にも着手している。

📖新刊情報|英語教育学海外論文解説 VOL.5』が刊行されました!▶第5号特集「読み・書き・対話を深化させるトランスランゲージングの可能性」

X
Amazon プライム対象