Mondo

研究の背景と意義

近年、人工知能技術の急速な発展により、教育分野においてもAIツールの活用が注目を集めています。特に、2022年に公開されたChatGPTは、その高度な言語生成能力により、語学教育における新たな可能性を提示しました。本稿で取り上げるのは、トルコのタルスス大学のネルミン・プナル・オズチェリク氏とガジ大学のゴンジャ・ヤンギン・エクシ氏による研究論文”Cultivating writing skills: the role of ChatGPT as a learning assistant—a case study”です。

この研究は、英語を外国語として学ぶ大学生がChatGPTを学習支援ツールとして活用した際の効果を、特に「レジスター(register)」と呼ばれる言語の文体や語域の習得に焦点を当てて検証したものです。レジスターとは、状況や文脈に応じて適切な言語使用を選択する能力を指し、フォーマル(正式)、インフォーマル(非正式)、ニュートラル(中立)といった使い分けが含まれます。例えば、上司への電子メールでは丁寧で正式な表現を用い、友人へのメッセージでは親しみやすい表現を使うといった具合です。

両研究者は、言語教育分野における専門家として、特にオズチェリク氏は外国語教育、エクシ氏は英語教授法を専門としており、AI技術と語学教育の融合という新しい分野に挑戦しています。研究が実施された2023年5月は、ChatGPTが教育現場で注目され始めた時期であり、その教育効果を実証的に検証する研究として意義深いものでした。

研究方法の検討と評価

本研究では、「ワンショット・ケーススタディ」と呼ばれる事前実験デザインが採用されています。この手法は、特定の介入(この場合はChatGPTの使用)を行った後の変化を観察する方法です。参加者は11名のトルコ人大学生で、工学部、経済・経営学部、教育学部に所属し、英語レベルはB1以上(中級以上)の学生たちでした。

研究手順は非常に体系的に設計されています。学生たちは2週間にわたって、週2回、各50分の授業に参加し、以下の4つの異なる文体での作文課題に取り組みました。

第一の課題は、就職を希望する会社の管理職に宛てた自己PR電子メールの作成(フォーマル文体、150-200語)でした。第二の課題は、時間管理スキルに関するブログ投稿の執筆(ニュートラル文体、150-200語)、第三の課題は、学生がキャンパスに望む設備について学長に宛てた要望書の作成(フォーマル文体、100-150語)、そして第四の課題は、都市の交通状況について友人に送るメッセージの作成(インフォーマル文体、50-75語)でした。

各課題において、学生たちはまず初稿を提出し、その後ChatGPTに文章の正確性を確認してもらい、最終的に修正版を提出するという流れが採用されています。この過程で研究者は学生たちの行動を観察し、フィールドノートを記録しました。さらに、すべての課題終了後には、学生たちへの非構造化インタビューが実施され、ChatGPT使用に関する意見や感想が収集されました。

研究方法の長所として、実際の教室環境での観察とインタビューを組み合わせた混合手法の採用が挙げられます。これにより、量的データだけでは捉えきれない学生の体験や感情的な反応も把握できています。また、異なる文体の課題を設定することで、ChatGPTの効果をより詳細に検証できている点も評価できます。

一方で、研究方法にはいくつかの限界も認められます。最も重要な点は、サンプルサイズの小ささです。11名という参加者数では、統計的な一般化は困難であり、結果の信頼性に影響を与える可能性があります。研究者たちもこの点を認識しており、2023年2月に発生したトルコの大地震の影響により、対面授業が困難となり、オンライン授業への移行を余儀なくされたことが参加者数の制限につながったと説明しています。

また、統制群の不在も重要な問題です。ChatGPTを使用しない学生群との比較がないため、観察された効果がChatGPTによるものなのか、単に練習や時間の経過による改善なのかを明確に判別することができません。さらに、研究期間が2週間と短期間であることから、長期的な学習効果については不明です。

研究結果の詳細分析

研究結果は、二つの主要な研究課題に基づいて整理されています。第一の研究課題「ChatGPTは学習支援ツールとして学生の自己添削能力向上に役立つか」に対する回答では、ChatGPTの効果は文体によって大きく異なることが明らかになりました。

フォーマルな文体に関しては、学生たちは明確な効果を実感していました。参加者の一人(P6)は「文章のレベルが上がる、これが利点だ」と述べ、別の学生(P9)は「B1レベルで書いたものをC1レベルまで引き上げてくれる。これが利点だ」と評価しています。学生たちは、ChatGPTが文法、句読点、文構造の改善提案を提供し、より専門的な表現への変更を支援してくれることを高く評価していました。

特に興味深いのは、学生たちがChatGPTとの対話を継続し、より詳しい説明や例を求める傾向が見られたことです。参加者の一人(P4)は「最も有益な利点は、いつでも修正してくれることだ」と述べ、別の学生(P6)は「理由を聞くと説明してくれた。『こう使った方が良い』と言ってくれた」と報告しています。

一方、インフォーマルな文体については、学生たちの反応は対照的でした。多くの学生が、友人へのメッセージのようなカジュアルな文章においてChatGPTの支援は不要だと感じていました。参加者の一人(P10)は「インフォーマルな文章には絶対に使わない。インフォーマルな言語には十分な英語知識があるが、フォーマルな文章には必要だ。文章をより専門的にしてくれる」と述べています。

興味深いことに、学生たちがスラングやカジュアルな表現を使った際、ChatGPTはこれらを間違いとして指摘する傾向があることも明らかになりました。しかし、学生たちは友人同士のメッセージにおいてはこのような表現が自然であると考え、ChatGPTの修正提案を拒否していました。参加者の一人(P8)は「ChatGPTはアルゴリズムの基盤を持っているため、カジュアルな言語の知識がない」と指摘し、別の学生(P9)は「インフォーマルなレジスターを知らない。ChatGPTにとってインフォーマルなレジスターはスラング言語の使用だけだ」と評価しています。

ニュートラルな文体については、さらに複雑な問題が浮上しました。参加者の一人(P3)は「ニュートラルな修正が気に入らない。テキストを大幅に変更してしまう。主に、ニュートラルな言語をフォーマルな言語に変える。ChatGPTはニュートラルな言語を知らないと思う。インフォーマルがそれほどインフォーマルでなければ、それもフォーマルにしてしまう」と述べています。

ChatGPTの技術的課題と学習支援の限界

研究では、ChatGPTの技術的な問題についても詳細に記録されています。学生たちは、ログインの困難さや回答の再生成に関する問題を経験していました。また、ChatGPTが時として不正確または混乱を招く修正を行うことも報告されています。

特に問題となったのは、ChatGPTが文章の意味や文脈を変更してしまう場合があることです。学生たちは、接続詞の使用に問題があり、文をより複雑にしてしまったり、不要または関係のない要素をテキストに追加したりすることがあると報告しています。参加者の一人(P6)は「使ってはいるが、言われた修正をすべて行うわけではない。変更された部分は使わない」と述べ、学生たちがChatGPTの提案を批判的に評価していることが分かります。

また、ChatGPTの説明不足も課題として挙げられました。学生たちは、なぜその修正が必要なのかについての詳細な説明を求める場合がありましたが、ChatGPTは必ずしも十分な説明を提供しませんでした。このことは、学習支援ツールとしての効果を制限する要因となっています。

学習理論的観点からの評価

研究では、ChatGPTの学習支援効果を複数の学習理論から説明しています。構成主義学習理論の観点では、ChatGPTが学習者のニーズと既存知識に適応したフィードバックを提供することで、自主的な学習構築を支援するとしています。社会構成主義の観点では、ChatGPTとの対話的なインターフェースが、自然な環境での協働を促進するとされています。

認知負荷理論からは、ChatGPTがフィードバックと対話インターフェースを組み合わせることで、不必要な認知負荷を軽減しながら、効果的学習に必要な認知負荷を増加させる可能性があるとしています。情報処理理論では、ChatGPTが各学習者の強みと弱み、学習スタイルに対応したフィードバックとガイダンスを提供することで、学習プロセスを支援するとされています。

しかし、これらの理論的説明は、実際の研究結果と完全に一致しているわけではありません。例えば、インフォーマルやニュートラルな文体における限界は、これらの理論では十分に説明されていません。

プロンプトエンジニアリングの重要性

研究において見落とされがちですが、重要な要素の一つがプロンプトエンジニアリング(適切な指示文の作成)です。参加者の一人(P2)は「異なる質問をしたとき、回答がより詳細になった」と述べており、ChatGPTへの質問の仕方が結果に大きく影響することが示されています。

研究では、各課題に対して標準化されたプロンプトが使用されましたが、学生たちは使用過程でより効果的な質問方法を学んでいました。例えば、「文法的な修正のみを行い、語彙選択は変更しないで」といった具体的な指示を与えることで、より満足のいく結果を得られることが分かってきました。

教育現場への実践的示唆

本研究の結果は、教育現場でのChatGPT活用について重要な示唆を提供しています。まず、フォーマルな文章作成の支援ツールとしてはChatGPTが有効である可能性が示されました。特に、ビジネス文書や学術的な文章の初稿作成において、学生の自信向上と文章品質の改善に寄与する可能性があります。

ただし、教育者は学生に対してChatGPTの提案を批判的に評価する能力を育成する必要があります。研究参加者たちが示したように、すべての修正提案を盲目的に受け入れるのではなく、文脈や意図に照らして適切性を判断する能力が重要です。

また、インフォーマルな文章やニュートラルな文章については、ChatGPTの限界を理解した上で使用する必要があります。特に、文化的なニュアンスやカジュアルな表現については、人間の教師や母語話者からの指導が依然として重要であることが示されています。

研究の限界と今後の課題

本研究は先駆的な取り組みとして評価できますが、いくつかの重要な限界があります。第一に、サンプルサイズの小ささは結果の一般化可能性を制限しています。11名という参加者数では、より広範な学習者集団への適用可能性を判断することは困難です。

第二に、研究期間の短さも課題です。2週間という期間では、ChatGPTを活用した学習の長期的効果を評価することはできません。言語学習における真の効果を測定するためには、より長期間の追跡調査が必要です。

第三に、統制群の不在により、観察された改善がChatGPTの使用によるものなのか、単純な練習効果によるものなのかを判別することができません。今後の研究では、ChatGPTを使用する群と使用しない群との比較研究が必要でしょう。

第四に、評価方法の客観性にも課題があります。学生の自己報告とインタビューに依存した評価では、主観的な印象に影響される可能性があります。より客観的な評価指標、例えば盲検法による専門家評価や標準化された言語能力テストの活用が望まれます。

ChatGPTの技術的発展と教育への影響

研究が実施された2023年5月の時点では、ChatGPT-3.5が使用されていましたが、その後のバージョンアップにより、言語理解能力や文脈把握能力は向上していると考えられます。特に、文化的なニュアンスやインフォーマルな表現の理解についても改善が期待されます。

しかし、技術の発展とともに新たな課題も生まれています。例えば、学生がChatGPTに過度に依存することで、自主的な思考力や創造性が低下する可能性があります。また、盗作や学術的不正行為の境界線が曖昧になる問題も指摘されています。

多言語・多文化環境での課題

本研究はトルコ人学生を対象としていますが、ChatGPTを多言語・多文化環境で使用する際の課題についても考慮が必要です。英語を母語としない学習者にとって、ChatGPTが提供する「標準的な」英語表現が、必ずしも学習者の文化的背景や使用目的に適合するとは限りません。

特に、ビジネス文書や学術的文章において、文化圏によって適切とされる表現方法や敬語の使い方は異なります。ChatGPTがアメリカ英語を基準とした修正を行う傾向がある場合、他の英語変種(イギリス英語、オーストラリア英語など)や国際的なビジネス文書の慣習との乖離が生じる可能性があります。

教師の役割の変化と専門性の重要性

本研究の結果は、AI技術の発展に伴う教師の役割の変化についても重要な示唆を提供しています。ChatGPTが基本的な文法や語彙の修正を効率的に行える一方で、文化的ニュアンス、文脈の理解、批判的思考の育成については、依然として人間の教師の専門性が不可欠であることが明らかになりました。

教師は、学生がChatGPTを効果的に活用できるよう指導する新たな役割を担う必要があります。これには、適切なプロンプトの作成方法、AI提案の批判的評価、人工知能の限界の理解などが含まれます。また、AI技術を活用しながらも、学習者の自主性と創造性を維持するバランスを取ることも重要な課題です。

結論:ChatGPTの教育的価値と慎重な活用の必要性

本研究は、ChatGPTが特定の条件下で英語ライティング学習の支援ツールとして有効である可能性を示しました。特に、フォーマルな文章作成において、学生の自信向上と文章品質の改善に寄与する可能性があります。また、学習者の積極的な参加と継続的な改善意欲を促進する効果も確認されました。

しかし、同時に重要な限界も明らかになりました。インフォーマルやニュートラルな文体における効果の疑問視、技術的な問題、文脈理解の限界などは、ChatGPTを教育現場で活用する際に慎重に検討すべき課題です。

今後の研究では、より大規模で長期的な調査、統制群を含む比較研究、客観的評価指標の導入などにより、ChatGPTの教育効果をより詳細に検証する必要があります。また、異なる文化的背景を持つ学習者や、様々な英語レベルの学習者を対象とした研究も重要でしょう。

教育現場においては、ChatGPTを万能な解決策として捉えるのではなく、特定の学習目標に対する補助ツールとして位置づけ、教師の専門的指導と組み合わせて活用することが重要です。学習者には、AI技術の能力と限界を理解し、批判的思考力を維持しながら活用する能力の育成が求められます。

AI技術と教育の融合は今後も継続的に発展していくと予想されますが、本研究はその初期段階における貴重な実証データを提供しており、今後の研究と実践の基盤となる重要な貢献をしています。技術の進歩と教育的価値のバランスを取りながら、学習者にとって真に有益な教育環境の構築を目指すことが、この分野の重要な課題となるでしょう。

研究デザインの詳細検討と代替手法の提案

本研究で採用された「ワンショット・ケーススタディ」は、新しい技術の教育効果を探索的に調査する初期段階としては適切な選択でした。しかし、より厳密な研究結果を得るためには、研究デザインの改善が必要です。

まず、準実験デザインの採用が考えられます。ChatGPTを使用する実験群と、従来の教師フィードバックのみを受ける統制群を設定し、同じ課題を実施することで、ChatGPTの効果をより明確に測定できるでしょう。さらに、第三の群として、ChatGPTと教師フィードバックを組み合わせた群を設定することで、最適な学習支援方法を探ることも可能です。

また、前後比較デザインの導入も重要です。学習者の初期能力を詳細に測定し、介入後の変化を客観的な指標で評価することで、真の学習効果を把握できます。特に、文体の使い分け能力については、標準化されたライティングテストや、専門家による盲検評価を活用することが望ましいでしょう。

文化的・言語的多様性への配慮

本研究はトルコという特定の文化的文脈で実施されましたが、英語学習における文化的要因の影響は軽視できません。トルコ語と英語の言語系統の違い、文章構成の慣習の相違、敬語表現の概念などが、ChatGPTの効果に影響を与える可能性があります。

例えば、トルコ語話者にとって英語の冠詞(a, an, the)の使用は困難な項目の一つですが、ChatGPTがこうした言語系統に特化した問題をどの程度効果的に修正できるかは、本研究では明確にされていません。今後の研究では、学習者の母語背景による効果の違いを詳細に分析することが必要でしょう。

また、英語の国際語(English as a Lingua Franca)としての使用が拡大する中で、ChatGPTが提示する「標準的な」英語が、必ずしも学習者の使用目的に適合するとは限りません。特に、アジア、アフリカ、中東などの非英語圏でのビジネス英語使用における慣習や表現方法は、ChatGPTが学習している主に欧米のデータとは異なる場合があります。

学習者の個人差と適応的学習

研究結果では、学習者の英語レベルによってChatGPTの効果が異なることが示唆されています。上級学習者はインフォーマルな表現において支援の必要性を感じない一方、初級学習者にとってはすべての文体において有用である可能性があります。

しかし、本研究では学習者の詳細な能力分析は行われていません。例えば、文法知識、語彙力、文章構成能力、修辞技法の理解など、ライティング能力の各要素における個人差が、ChatGPTの効果にどのように影響するかは不明です。個人の学習スタイル、動機、技術に対する態度なども、重要な変数となる可能性があります。

今後の研究では、学習者の詳細なプロファイリングを行い、どのような特性を持つ学習者にとってChatGPTが最も効果的かを明らかにすることが重要です。これにより、個々の学習者に最適化された学習支援の提供が可能となるでしょう。

評価指標の精緻化と客観性の確保

本研究の評価は主に学習者の主観的報告とインタビューに基づいていますが、より客観的で精密な評価指標の導入が求められます。例えば、文体の適切性については、言語学的特徴の定量的分析(語彙の複雑さ、文構造の多様性、敬語表現の使用頻度など)を行うことで、より科学的な評価が可能となります。

また、学習過程の詳細な分析も重要です。学習者がChatGPTの提案をどの程度採用したか、どのような修正を拒否したか、その理由は何かなどを体系的に記録・分析することで、ChatGPTと学習者の相互作用をより深く理解できるでしょう。

さらに、長期的な学習効果の測定も不可欠です。本研究では2週間という短期間での効果のみが検証されましたが、ChatGPTを継続的に使用することで、学習者の自立的なライティング能力がどのように発達するかは重要な問題です。

教育政策・制度への示唆

本研究の結果は、教育制度レベルでの議論にも重要な示唆を提供しています。AI技術の教育活用が進む中で、カリキュラムの設計、教師研修の内容、評価方法の改革などについて検討が必要です。

特に、ライティング教育において何を「学習成果」とするかについて、従来とは異なる視点が求められるかもしれません。ChatGPTが基本的な文法や語彙の修正を効率的に行える状況では、教育の重点を創造性、批判的思考、文化的適応性などのより高次な能力に移すべきかもしれません。

また、学術的誠実性(academic integrity)についても新たな基準の策定が必要です。ChatGPTを活用した作文がどの程度まで許容されるか、どのような使用方法が適切か、引用や出典表示の方法はどうあるべきかなど、明確なガイドラインの制定が求められています。

このように、本研究は限定的な条件下での探索的調査でありながら、AI技術と語学教育の融合について多くの重要な問題を提起しています。技術の急速な発展と教育現場のニーズを踏まえながら、より包括的で長期的な研究が継続されることが期待されます。そして何より、学習者にとって真に有益な教育環境の構築を目指し、技術と人間の専門性を適切に組み合わせた教育手法の開発が重要な課題となるでしょう。


Punar Özçelik, N., & Yangın Ekşi, G. (2024). Cultivating writing skills: the role of ChatGPT as a learning assistant—a case study. Smart Learning Environments, 11, Article 10. https://doi.org/10.1186/s40561-024-00296-8

By 吉成 雄一郎

株式会社リンガポルタ代表取締役社長。東京電機大学教授、東海大学教授を経て現職。コロンビア大学大学院ティーチャーズカレッジ(英語教授法)、信州大学大学院工学研究科(情報工学)修了。専門は英語教授法、英語教育システム開発。 さまざまな英語学習書、英検、TOEIC 対策書、マルチメディア教材等を手がけてきた。英語e ラーニングや英語関係の教材・コンテンツの研究開発も行う。全国の大学、短期大学、高専等で使われているe ラーニングシステム「リンガポルタ」も開発した。最近ではAI による新しい教育システムの開発にも着手している。

Amazon プライム対象