研究の出発点:なぜ企業の言葉を分析するのか

企業が発表する年次報告書や株主への手紙を読んだことがある方なら、その言葉遣いの微妙な変化に気づいたことがあるかもしれません。好調な年には「成長」「拡大」「成功」といった前向きな言葉が踊り、不調な年には「困難な環境」「前例のない状況」といった表現が目立つようになります。こうした言葉の選び方や使い方のパターンを科学的に分析することで、企業の本音や戦略、さらには社会情勢の影響まで読み取ることができるのではないか。そんな発想から生まれた研究分野が、コンピュータを使った文章分析です。

イルセ・ポラハ(Irene Pollach)氏による本論文”Taming textual data: The contribution of corpus linguistics to computer-aided text analysis”は、従来の経営学研究で使われてきたコンピュータ支援文章分析手法に、言語学の分野で発達したコーパス言語学の技術を導入することを提案しています。ポラハ氏はオーストリアのウィーン経済大学で情報システム論を専門とする研究者で、特に企業コミュニケーションとデジタル技術の交差点での研究を行っています。この論文は2012年に権威ある学術誌『Organizational Research Methods』に掲載されたもので、学際的なアプローチで新しい分析手法を提案した意欲的な研究として注目されました。

三つのアプローチの比較:それぞれの特徴と限界

論文の前半では、文章を分析する三つの主要なアプローチが整理されています。まず、従来から経営学で使われてきた「コンピュータ支援内容分析」は、あらかじめ決められたカテゴリーや辞書を使って、文章中の特定の概念の出現頻度を数える手法です。例えば、「革新」「品質」「顧客満足」といったキーワードが企業の文書にどれくらい登場するかを調べることで、その企業の価値観や戦略的重点を定量的に把握しようとします。

一方、「コンピュータ支援解釈的文章分析」は、より質的なアプローチで、文章の意味や解釈に重点を置きます。この手法では、コンピュータは主に文章の整理や検索を支援する道具として使われ、実際の分析は研究者が文脈や背景を考慮しながら行います。

そして第三の選択肢として提案されるのが「コーパス言語学」です。これは言語学の分野で発達した手法で、大量の実際の言語使用例(コーパス)を統計的に分析することで、言語のパターンや特徴を明らかにします。ポラハ氏は、この三つのアプローチをそれぞれ「概念重視」「意味重視」「語彙パターン重視」と特徴づけています。

興味深いのは、コーパス言語学が量的分析と質的分析を必ず組み合わせる点です。数字だけでは意味がないし、直感だけでは客観性に欠ける。両方を組み合わせることで、より深く正確な分析が可能になるという考え方です。これは、しばしば量的か質的かという二者択一の議論に陥りがちな社会科学研究にとって、重要な示唆を含んでいます。

実証研究:金融危機の言葉を解剖する

論文の後半では、コーパス言語学の手法を実際に適用した分析例が詳しく紹介されています。分析対象は、2006年(金融危機前の正常年)と2008年(金融危機の年)の欧米大手銀行155行の株主向け書簡です。2006年の書簡は約12万語、2008年の書簡は約13万語という大規模なデータセットです。

まず実施されたのは「キーワード分析」です。これは二つの時期の文書を統計的に比較し、どちらかの時期により頻繁に使われる単語を特定する手法です。結果は予想通りながら印象的でした。2008年には「crisis(危機)」「loss(損失)」「recession(不況)」「difficult(困難)」「downturn(景気後退)」といった否定的な語彙が目立つ一方、2006年には「growth(成長)」「improve(改善)」「expand(拡大)」「success(成功)」「achieve(達成)」といった前向きな語彙が頻出していました。

しかし、コーパス言語学の真価はここから発揮されます。単純な頻度分析を超えて、より深い分析が展開されるのです。

言葉の分散と結合:見えない構造を明らかにする

特に興味深いのは「語の分散度」の分析です。ある単語が特定の企業の文書にのみ集中して現れるのか、それとも多くの企業で均等に使われているのかを調べる手法です。例えば、「システム」という単語は2008年に頻出していましたが、実は一社が全体の約半分を使っており、業界全体の傾向とは言えないことが判明しました。このような詳細な検証により、真に意味のあるパターンを見極めることができます。

さらに注目すべきは「コロケーション分析」です。これは単語の組み合わせパターンを調べる手法で、単語が個別に使われる場合とは異なる意味や印象を生み出すことがあります。例えば、「we believe(私たちは信じています)」という表現が2008年の書簡で有意に増加していることが発見されました。詳しく調べると、この表現の65%が「信頼回復」や「安心感の提供」の文脈で使われており、危機時の企業コミュニケーションの特徴的なパターンであることが明らかになりました。

五つのテーマ:危機時の企業言説の構造

一連の分析を通じて、2008年の銀行の株主向け書簡には五つの特徴的なテーマが浮かび上がりました。

「環境」というテーマでは、不良な業績を外部環境のせいにする表現が多用されていました。「このような状況下では」「前例のない市場環境」といった表現により、責任を外部に転嫁する論理構造が構築されています。

「リスク管理」のテーマでは、「慎重な姿勢」「保守的な運営」といった表現により、今後は安全運転で行くという姿勢をアピールしています。

「安心感の提供」では、「自信」「確信」「楽観」といった語彙により、将来への希望を表現しようとしています。

一方で、通常時には重要だった「戦略」と「人材」というテーマは、2008年には相対的に影を潜めました。危機時には、長期的な展望よりも当面の説明と弁明が優先されるという、企業コミュニケーションの現実的な側面が浮き彫りになっています。

手法の革新性と実用的価値

この研究の最も価値のある貢献の一つは、従来別々に発達してきた分野の手法を統合したことです。経営学の研究者は内容分析に慣れているものの、言語学の精緻な分析技術にはあまり触れる機会がありませんでした。逆に言語学者は言語分析の専門家ですが、経営や組織の文脈での応用には不慣れです。ポラハ氏の研究は、この溝を埋める橋渡し的な役割を果たしています。

特に実用的なのは、WordNetという語彙データベースの活用提案です。これは15万語以上の英語の語彙とその意味関係を体系化したデータベースで、研究者が辞書を作成する際に、類義語や関連語を漏れなく発見できるよう支援します。従来の主観的な辞書作成から、より客観的で網羅的なアプローチへの道を開いています。

限界と課題:万能薬ではない現実

しかし、この手法にも明確な限界があります。まず、論文で紹介された技術の多くは英語圏でのみ利用可能です。WordNetや既存の大規模コーパスは主に英語で構築されており、他言語での研究には直接適用できません。グローバル化が進む現代において、これは重要な制約です。

また、言語の微妙なニュアンスや文脈への理解が必要不可欠です。例えば、同じ単語でも業界や時代によって意味が変わることがあります。「プラットフォーム」という言葉は、鉄道業界では駅のホームを意味しますが、IT業界では技術基盤を指します。こうした多義性を適切に処理するには、研究者の高い言語的感性と専門知識が求められます。

さらに深刻なのは、分析の主観性の問題です。どの統計手法を使うか、どこで基準値を設定するか、どのように結果を解釈するかなど、研究者の判断に依存する部分が多数存在します。ポラハ氏も論文中でこの点を率直に認めており、「絶え間ない検証、反省、批判、文脈化、改良、適応」の必要性を強調しています。

方法論的な懸念:統計の魔法に惑わされる危険

統計的手法の多用は、一見客観的で科学的な印象を与えますが、実際には多くの主観的判断を含んでいます。例えば、コロケーションの強度を測る三つの異なる統計手法(相互情報量、Z得点、対数尤度比)は、しばしば異なる結果を示します。研究者はどれを採用するか、あるいはどのように組み合わせるかを決める必要がありますが、その判断基準は必ずしも明確ではありません。

また、大量のデータを扱うことで、統計的に有意な差は発見しやすくなりますが、それが実質的に意味のある差であるかは別問題です。「統計的有意性」と「実践的重要性」を混同する危険は、ビッグデータ時代の研究における共通の落とし穴です。

学際研究の難しさ:二つの文化の狭間で

この研究が直面するもう一つの課題は、学際的アプローチ特有の困難です。言語学と経営学では、研究の伝統、用語、評価基準が大きく異なります。言語学者が重視する精緻な言語分析は、経営学者には過度に複雑に見えるかもしれません。逆に経営学者が求める実践的示唆は、言語学者には表面的に感じられるかもしれません。

ポラハ氏の研究は、この二つの分野を橋渡しする野心的な試みですが、どちらの分野の研究者からも完全に受け入れられるかは疑問です。新しい手法の普及には、単なる技術的優秀性だけでなく、研究コミュニティでの受容性も重要な要因となります。

現代への示唆:デジタル時代の文章分析

2012年に発表された この研究は、その後のデジタル時代の文章分析技術の発展を先取りしていた面があります。近年注目されている自然言語処理やテキストマイニングの技術も、本質的にはここで提案されているアプローチの延長線上にあります。

特に、大量のテキストデータから意味のあるパターンを発見するという課題は、ソーシャルメディア分析、カスタマーレビュー分析、ニュース分析など、現代の様々な分野で重要性を増しています。ポラハ氏が提示した「量的分析と質的分析の組み合わせ」「統計的手法と解釈的手法の統合」という発想は、今日でも十分に通用する原則です。

研究の意義と限界:バランスの取れた評価

この研究の最大の価値は、従来の経営学研究に新しい分析の視点と技術を導入したことです。企業の文書を単なるデータの山としてではなく、言語的な工夫と戦略が織り込まれたコミュニケーションの産物として捉える視点は重要です。特に、危機時の企業コミュニケーションの分析は、経営者や投資家、規制当局にとって実践的な価値があります。

一方で、手法の複雑さと学習コストの高さは、普及の障壁となりそうです。多くの経営学研究者にとって、コーパス言語学の技術習得は相当な投資を要求します。その投資に見合うだけの追加的価値があるかどうかは、研究者の問題意識と利用可能な資源によって変わるでしょう。

また、分析結果の解釈において、言語学的知識と経営学的知識の両方が必要となることも課題です。どちらか一方の専門性だけでは、手法を適切に活用することは困難です。学際的研究の宿命でもありますが、専門性の深さと広さのバランスを取ることは簡単ではありません。

結論:新しい工具箱の可能性と責任

ポラハ氏の研究は、コーパス言語学を「技法の工具箱」として経営学研究に導入することを提案しています。この比喩は適切で、新しい工具は新しい可能性を開く一方で、適切な使い方を身につける必要があることを示唆しています。

金融危機時の銀行の株主向け書簡分析は、この新しい工具箱の有効性を実証する説得力のある事例でした。従来の分析では見逃されがちな言語的パターンを発見し、企業コミュニケーションの構造的特徴を明らかにしました。しかし、その価値を最大化するには、研究者側の継続的な学習と、手法の限界に対する冷静な認識が不可欠です。

この研究が提起している本質的な問いは、「言葉をどのように科学的に分析するか」という、人文科学と社会科学が長年向き合ってきた根本的な課題でもあります。完璧な解答はありませんが、複数の手法を組み合わせ、量的分析と質的分析を統合し、絶えず検証と改良を重ねるという姿勢は、今後の研究発展にとって重要な指針となるでしょう。


Pollach, I. (2012). Taming textual data: The contribution of corpus linguistics to computer-aided text analysis. Organizational Research Methods, 15(2), 263-287.

By 吉成 雄一郎

株式会社リンガポルタ代表取締役社長。東京電機大学教授、東海大学教授を経て現職。コロンビア大学大学院ティーチャーズカレッジ(英語教授法)、信州大学大学院工学研究科(情報工学)修了。専門は英語教授法、英語教育システム開発。 さまざまな英語学習書、英検、TOEIC 対策書、マルチメディア教材等を手がけてきた。英語e ラーニングや英語関係の教材・コンテンツの研究開発も行う。全国の大学、短期大学、高専等で使われているe ラーニングシステム「リンガポルタ」も開発した。最近ではAI による新しい教育システムの開発にも着手している。

Amazon プライム対象