はじめに―言語が「通じる」とはどういうことか
外国語を学ぶとき、多くの人はまず文法や単語から入ります。「私は学生です」という文を正確に作れるようになり、「どこに行きますか」と聞けるようになる。でも、言語を使いこなすということは、それだけではありません。たとえば、日本語を学んでいる外国の方が「これ、おもしろいですね」と言われたとき、それが純粋な感想なのか、遠回しな批判なのか、あるいは単なる話題つなぎなのかを読み取るのは、文法の知識だけではどうにもなりません。
言語学ではこの領域を「語用論(pragmatics)」と呼びます。語用論とは、発話がどのような社会的文脈で、どのような意図のもとに使われているかを研究する分野です。文法的に正しくても語用論的に的外れな発言は、時として「失礼」「奇妙」「冷たい」と受け取られます。文化の違いが絡めば、誤解は一層深まります。
この論文―”Assessing pragmatic comprehension competence in Chinese as a second/foreign language: From the perspective of speech acts in Chinese”、すなわち「中国語を第二言語または外国語として学ぶ学習者の語用理解能力の評価」―は、まさにこの問題に正面から取り組んだ研究です。著者はJing Jin(香港教育大学)、Yang Yang(同)、そしてJieun Lee(梨花女子大学)の三名で、2025年に『International Journal of Applied Linguistics』に掲載されました。研究資金は香港研究助成局の一般研究基金(No.18613722)によって提供されています。
「言語行為」という考え方
この研究を理解するうえで、まず「言語行為(speech acts)」という概念を押さえておく必要があります。言語哲学者のJ. L. Austin(1962)が提唱し、J. R. Searle(1979)が精緻化したこの考え方によれば、発話とは単なる情報伝達ではなく、何らかの「行為」を伴うものです。
Searleは言語行為を五つの大カテゴリに分類しました。話し手の信念を表す「陳述型(assertives)」、聞き手に何かをするよう求める「指令型(directives)」、話し手が何かをすると約束する「承諾型(commissives)」、話し手の心理的態度を表す「表出型(expressives)」、そして現実の状態を変える「宣言型(declaratives)」です。
この研究では、日常会話での使用頻度が低い宣言型を除いた四つのカテゴリを対象とし、さらにそれぞれを二つのサブタイプに分けています。陳述型なら「説明する」と「コメントする」、指令型なら「依頼する」と「アドバイスする」、承諾型なら「約束する」と「申し出る」、表出型なら「謝罪する」と「感謝する」、という具合です。
また、Brown and Levinson(1987)の礼節理論に基づいて、各言語行為は「PDR-low(対等な関係、近い社会的距離、小さな負担)」と「PDR-high(不対等な関係、遠い社会的距離、大きな負担)」という二つの社会的対人状況に振り分けられています。つまり、友人同士の気軽な依頼と、教授への丁寧な申し入れとでは、言語行為のあり方が変わってくるという視点です。
研究の設計―何を、誰に、どうやって測ったか
研究の舞台は中国大陸と韓国の大学です。中国大陸で中国語を学ぶCSL(Chinese as a Second Language)学習者34名と、韓国で中国語を学ぶCFL(Chinese as a Foreign Language)学習者54名、合計88名が最終的な分析対象となりました。加えて、比較の基準となるネイティブスピーカー13名のデータも収集されています。
参加者は習熟度によって「中級」(66名)と「上級」(22名)に分類されました。この分類は、自己申告による中国語能力評価、学習期間、そして課題に含まれた文法判断項目の正答率という三つの基準を組み合わせて行われています。単一の指標に頼らない、堅実なアプローチといえます。
測定ツールは「コンピュータ化語用リスニング判断タスク(PLJT)」です。参加者はGorilla(Anwyl-Irvine et al., 2020)というオンラインプラットフォーム上で、音声と文字で提示される中国語の会話場面を聞き、ある発話が「その状況において適切かどうか」を1から5の五段階で評価します。同時に、回答にかかった時間(反応時間)も自動的に記録されます。
なぜ反応時間まで測るのでしょうか。これはBialystok(1993, 2011)の「二次元アプローチ」に基づいています。言語発達には「知識の分析」と「処理の制御」という二つの認知プロセスがあるとされており、正確さが知識の深さを示すとすれば、反応時間は処理の流暢さを示すと考えられます。つまり、「わかっているけどすぐには出てこない」という状態と、「体に染みついているので即座に判断できる」という状態を区別しようとしているわけです。
全32問の評価項目は、適切な発話(acceptable items)と不適切な発話(unacceptable items)がそれぞれ16問ずつ含まれており、文法判断のためのフィラー10問と練習問題5問と合わせて47問構成です。タスク全体の所要時間は約20分とされています。
三つの問いと、それぞれの答え
研究は三つのリサーチクエスチョンを設定しています。
問い1 ― 言語行為の種類によって習熟度は異なるか
結果は明快でした。どの言語行為カテゴリについても、学習者とネイティブスピーカーの間には統計的に有意な差が見られました。ただし、その差の大きさは均一ではありませんでした。指令型と表出型は、陳述型や承諾型と比べると、学習者の判断がネイティブに近かったのです。
これは直感的にも納得がいきます。「お願いします(qǐng)」「ありがとう(xièxie)」「すみません(duì bu qǐ)」といった指令型や表出型の言語行為は、予測可能な定型表現を伴うことが多く、日常会話でも頻繁に登場します。一方、承諾型の「約束する」「申し出る」や、陳述型の「説明する」「コメントする」は、より複雑な文脈判断を必要とします。
さらに詳細なサブタイプ分析では、「依頼する」と「コメントする」については、学習者がほぼネイティブ並みの判断を示しました。著者たちはこれを「語用論的普遍性」の観点から説明しています。Chen et al.(2013)の研究によれば、依頼という行為は中国語、英語、日本語を問わず、PDR-highの状況では間接的表現を、PDR-lowの状況では直接的表現を選ぶという普遍的なパターンがあります。学習者はすでにL1(母語)でその知識を持っており、それが中国語にも転用できるというわけです。
対照的に、最も難しかったのは「謝罪する」でした。四つの条件のうち三つで、学習者はネイティブと有意に異なる判断をしていました。中国語の謝罪には「面子(miànzi)」という文化概念が深く絡んでいて、権威関係や社会的序列を踏まえた複雑な判断が求められます。Lee(2018)の指摘するように、この種の面子管理ストラテジーは、文化的背景なしには習得が難しいのです。
反応時間データも興味深い結果を示しました。「感謝する」や「謝罪する」の適切な発話に対して、学習者はネイティブよりも有意に短い時間で反応しました。これは一見矛盾のように見えますが、著者たちはこう解釈しています。ネイティブスピーカーは表出型言語行為を評価するとき、単に形式的な適切さだけでなく、「相手の面子を十分に立てているか」という複層的な文化的判断を行うため、時間がかかる。一方、学習者はそこまでの深みに至っていないため、表面的な判断で素早く回答してしまう、ということです。
問い2 ― 習熟度は語用理解に影響するか
この問いに対する答えは「影響する、ただし複雑な形で」というものです。
正答率(判断スコア)においては、習熟度の影響が明確に現れました。中級学習者はすべての言語行為カテゴリにおいて、ネイティブとの間に有意な差を示しました。上級学習者は、適切な発話の判断についてはすべてのカテゴリでネイティブ並みのパフォーマンスを示しましたが、不適切な発話の判断については「承諾型」と「表出型」でまだ差が残っていました。
「不適切な発話を不適切と見抜く」のは、「適切な発話を適切と認める」よりも難しいということです。これは「何が正しいかを知ること」と「何がおかしいかを感知すること」の非対称性を示しており、語用論の習得における興味深い非線形性を示唆しています。
一方、反応時間については、習熟度グループ間でほとんど有意な差は見られませんでした。つまり、習熟度が上がると正確さは向上するが、処理速度はあまり変わらない、ということになります。著者たちはこれを、処理速度と正確さが独立した認知プロセスに依拠している可能性として論じており、今後の研究課題として反応時間データの混合法的分析を提案しています。
問い3 ― 学習環境(第二言語 vs. 外国語)は語用理解に影響するか
三つ目の問いは、研究の中で最も政策的・教育的含意の大きいものです。
結果として、CSL学習者とCFL学習者の間には統計的に有意な差は認められませんでした。両グループともネイティブとは差があるものの、互いの差はほぼなかったのです。これは、「中国語圏に住んでいれば語用論は自然に身につく」という直感的な仮説を否定するものです。
ただし、細かく見ると、CSL学習者はCFL学習者よりもネイティブとの乖離がやや小さい傾向がありました。また、反応時間においてはCSL学習者の方が全体的にやや速く反応する傾向が見られましたが、統計的な有意差には達しませんでした。
この結果は、Xiao(2023)の英語学習者に関する研究と一致しており、学習環境の違いが語用的能力の決定的な差を生むわけではないことを示唆しています。著者たちは、意図的な語用論の教育(instructed pragmatic learning)の重要性を強調します。自然なインプットだけでは語用能力の習得は保証されないのです。
研究の評価―何が優れていて、何が課題か
この研究にはいくつかの顕著な強みがあります。まず、語用論の研究において産出(production)ではなく理解(comprehension)に焦点を当てた点が新鮮です。先行研究の多くが「ロールプレイ」や「ディスコース・コンプリーション・タスク」を用いて学習者が言語行為をどのように「産み出すか」を測定してきた中で、この研究は「聞いて理解できるか」という側面を正面から扱っています。理解と産出の非対称性についてはTasseva-Kurktchieva(2015)も指摘しており、この問いは語用論習得研究において依然として重要な課題です。
次に、正確さと反応時間を組み合わせた方法論は、Bialystokの理論的枠組みと整合しており、言語能力の多面的な評価を可能にしています。単純な正誤判定にとどまらず、「処理の速さ」という次元を加えることで、習熟度の違いをより精密に描き出しています。
また、CSLとCFLという二つの学習環境を直接比較した研究は少なく、この設計自体が先行研究への貢献として評価できます。
一方で、いくつかの限界も正直に認めるべきです。サンプルサイズの不均衡は著者たちも認めている通りで、CSLグループが34名、CFLグループが54名というアンバランスは、比較の精度に影響する可能性があります。元々は均衡していたものが、データクリーニングの過程でCSL側が大幅に減ったという経緯は、結果の解釈に慎重さを求めます。
習熟度の分類にHSK(漢語水平考試)のような標準化されたテストスコアではなく、自己申告を主要基準の一つとして使っている点も弱点です。著者たちは自己申告の妥当性を示す先行研究(Marian et al., 2007; Sheng et al., 2013)を引用しながら正当化していますが、この点についてはより堅固な客観指標があれば説得力が増したでしょう。
また、研究対象がCFL側はほぼ韓国語話者であり、参加者の母語が結果に影響している可能性も排除できません。韓国語と中国語は類型論的にも語用論的にも距離の違いがあり、英語や日本語母語話者との比較が今後の研究で求められます。
日本の英語教育現場への示唆
この研究は中国語教育を対象としていますが、その知見は日本の英語教育現場にも多くの示唆を与えます。
まず、「正確さ」と「処理速度」の乖離という発見は示唆的です。日本の英語教育では長らく、文法的正確さが最重要視されてきました。しかし、語用論的能力は文法能力とは独立した次元を持ちます。文法的に正しい英文を書けても、ネイティブスピーカーの断り表現の含意を即座に理解したり、丁寧な依頼と皮肉の依頼を瞬時に区別したりできるかどうかは別問題です。
日本の中学・高校の英語教育では、2020年代の学習指導要領改訂でコミュニケーション能力の育成が強調されていますが、語用論的な側面は教材にも試験にも反映されにくいのが実情です。Roever(2022)が指摘するように、語用論はほとんどの言語コースで系統的に教えられておらず、教科書にも取り上げられず、試験にも含まれていません。
この研究の発見、特に「没入型環境でも語用論的能力は自動的に育まない」という知見は、海外留学や英語圏での生活が英語の語用能力を保証するわけではないことを示します。日本人英語学習者が長期留学後も「失礼な英語」を使い続けることが観察されることと符合します。
また、「謝罪する」という言語行為が最も習得困難だったという結果は、日英間の語用論的ギャップを考える上でも興味深いです。日本語の謝罪表現と英語のものは、使用頻度、機能、社会的期待値すべてにおいて大きく異なります。たとえば日本語では「申し訳ございません」がビジネス場面で頻繁に用いられるのに対し、英語では過度な謝罪が弱さや問題の自認と解釈されることもあります。このような文化的ギャップへの意識的な指導が、日本の英語教育でも必要とされています。
さらに、著者たちがAI活用の可能性として言及しているSung and Kang(2024)の研究、すなわちAIチャットボットが対話者の性別・年齢・役割などの文脈パラメータを調整しながら英語の語用論学習を支援できることを示した研究は、日本の教室でも参考になる視点です。個別化された語用論的フィードバックをAIが提供することで、教師の負担を増やさずに語用能力の育成を促進できる可能性があります。
関連研究との対比
この研究がどの程度、既存の研究の流れの中に位置づけられるかを見ておくことも重要です。
L2英語における語用論習得研究の文脈では、Taguchi(2007a)が英語外国語学習者における語用理解の速さと正確さの発達を調査し、熟達度が両者に影響することを示しました。本研究はこれを中国語に展開したものとみなせますが、結果の一部に違いもあります。Taguchiの研究では熟達度が反応時間にも一定の影響を及ぼしていたのに対し、本研究では反応時間への影響はほとんど見られませんでした。この違いが言語の違いを反映するのか、タスクの設計の差異によるものなのかは、今後の比較研究が必要です。
Schauer(2006)は、英語FL学習者がL2学習者に比べて英語語用論的特徴への意識が低いことを示しましたが、本研究ではCSLとCFLの間に統計的有意差は見られませんでした。この相違は、英語と中国語の習得環境の違い、あるいは対象とした語用論的現象の差(Schauerはインプット量の認識を主に扱った)に由来する可能性があります。
CSL/CFL語用論研究の蓄積についていえば、Li et al.(2023)が1995年から2022年の研究をレビューしているように、産出研究が中心で理解研究は少ない状況が続いています。本研究はその空白を埋める試みとして重要な位置を占めます。
独自の学術的考察
最後に、本論文が提起するより大きな問いについて考えてみたいと思います。
語用論的能力の習得が「不均衡」に進むという発見は、言語発達の根本的な非線形性を示しています。私たちはしばしば、言語能力を一次元的なスケールで測りたがります。「上級」か「中級」か、といった具合に。しかし現実には、文法が上達しても語用論は遅れ、依頼は上手でも謝罪が下手、高頻度の表現は習得できていても文化特有の含意は読めない、といった複雑なモザイク模様をなしています。
この「モザイク模様」をどう評価し、どう指導するかは、語用論研究のみならず言語テスティング全般にとっても重要な課題です。Bachman and Palmer(1996, 2010)の言語能力モデルでは、語用的能力が言語能力の不可欠な構成要素として位置づけられています。しかし現実の試験設計では、語用能力をどのように操作的に定義し測定するかについての合意はいまだ十分ではありません。
また、反応時間と正確さの乖離という現象は、暗示的知識と明示的知識の区別という認知言語習得論の核心的問題と結びついています。上級学習者が適切な発話については正確に判断できるのに、依然として反応時間がネイティブと同水準に達していないとすれば、それは「わかっているが自動化されていない」ことを示唆しているかもしれません。言語知識の自動化は、繰り返しの使用と豊富な文脈的インプットなしには達成されにくく、教室だけでは限界があります。
一方、この研究が触れることができなかった側面もあります。学習者の個人差、特に動機付けや性格特性が語用論的能力に与える影響については、Takahashi(2005)やYang and Lian(2023)が指摘するように無視できません。社会的外向性の高い学習者は、表出型言語行為のような対人的に明示的な発話形式を習得しやすいかもしれませんが、本研究のデータからはその点を検証することはできません。
さらに根本的な問いとして、「ネイティブ並み(nativelike)」という基準自体をどう扱うかという問題があります。この研究では、ネイティブスピーカー13名の判断が「正解」の基準として用いられています。しかし、言語の多様性と変化を考えるとき、特定の話者集団の規範を絶対的な基準とすることへの批判的視点も必要です。Timpe-Laughlin et al.(2015)が指摘するように、語用的適切さとは固定した基準ではなく、文脈と交渉によって動的に決まるものでもあります。
おわりに
Jin, Yang, Leeの三名による本研究は、中国語語用論習得の実証的研究として丁寧に設計され、堅実な分析に基づいた知見を提供しています。言語行為の種類によって習熟度に違いが生じること、習熟度の向上が処理速度よりも正確さに先行して現れること、そして学習環境の違いが語用能力の決定因子とはいえないこと、これらの発見はCSL/CFL教育にとどまらず、言語習得研究全体への貢献となっています。
中国語を学ぶ学習者にとっても、それを教える教師にとっても、「謝罪の仕方がわからない」「面子を傷つける言い方を避けられない」という問題は切実なものです。この研究は、そうした問題を直感や経験則ではなく、実証的データに基づいて議論するための土台を提供しています。
言語を学ぶとは、単語と文法の積み重ねではなく、もう一つの文化的文脈のなかで「ことばの意図」を感知する能力を育てることでもあります。それがいかに難しく、いかに豊かな課題であるかを、この研究は改めて示してくれています。
Jin, J., Yang, Y., & Lee, J. (2025). Assessing pragmatic comprehension competence in Chinese as a second/foreign language: From the perspective of speech acts in Chinese. International Journal of Applied Linguistics, 35, 2183–2200. https://doi.org/10.1111/ijal.12762
