見積依頼
無料相談
調査レポート
サービス資料
セミナー
申込
見積依頼
無料相談
調査レポート
サービス資料
セミナー
申込
見積依頼・無料相談 資料ダウンロード セミナー申込

マーケティングリサーチコラム

マーケティングリサーチの電通マクロミルインサイト TOP マーケティングリサーチコラム AI時代のテキストマイニングとは?大規模言語モデルを活用したトピックモデリング入門

AI時代のテキストマイニングとは?大規模言語モデルを活用したトピックモデリング入門

2026.02.02
集計・分析・フレームワーク

前回の記事では、テキストマイニングの基本手法について解説しました。しかし近年のAI技術、とりわけ大規模言語モデル(LLM)の発展により、自由記述分析は大きな転換期を迎えています。

本コラムでは、AI時代におけるテキストマイニングの進化と、大規模言語モデルを活用したトピックモデリングの考え方やアウトプットについて解説します。

AI時代のテキストマイニング

自由記述データの分析といえば、単語の出現頻度や共起関係を可視化する、「テキストマイニング」が主流です。この手法は、大量の回答を俯瞰し、全体傾向を把握するうえで、現在も有効なアプローチです。

一方で近年、AI技術、特に大規模言語モデル(LLM)の発展により、自由記述分析のあり方は大きく変わりつつあります。単語単位ではなく、文章が持つ意味や文脈そのものを捉えることが可能になり、テキストマイニングは新たな段階に入りました。

本コラムでは、AI時代におけるテキストマイニングの変化・発展と、大規模言語モデルを活用したトピックモデリングの概要やアウトプットについて解説します。

AIの発展により何が変わるか?

AI時代のテキストマイニングで最も大きな変化は、「どんな単語が使われているか」から「何について語られているか」へと、分析の視点が移った点にあります。

発展(1)言い回しの違いを超えて、意味でまとめる

従来のテキストマイニングでは、同じ内容でも言葉の使い方が違うだけで、意見が分断されてしまうという課題がありました。

例えば、「操作が分かりづらい」「使い方に慣れるまで時間がかかる」「UIが直感的ではない」といった回答は、いずれも操作性への不満を指していますが、単語が異なるため、意見が分散して見えてしまいます。

AIを活用したテキストマイニングでは、文章データを、意味を反映した数値に変換(エンベディング)し、意味の近さにもとづいて整理します。

そのため、表現が異なっても、これらの回答は一つの話題として自然にまとまります。

発展(2)少数でも埋もれない、論点として浮かび上がる

従来の手法では、出現頻度の高い意見ほど目立ち、件数の少ない意見は評価されにくいという課題がありました。

しかし、例えば「情報の正確性が少し不安」といった意見は件数は多くなくても、サービス改善やリスク管理の観点では見逃せない論点です。

AIを活用した分析では、件数の多寡ではなく意味の一貫性にもとづいて文章が整理されるため、少数意見であっても、一貫した論点を持つものは一つのトピックとして可視化されます。

発展(3)分析者依存の整理データ主導の話題抽出

従来のテキストマイニングでは、どの単語を軸にまとめるかによって、分析結果の見え方が分析者の仮説や経験に左右されやすい、という課題がありました。

AIを活用したトピックモデリングでは、事前に切り口を細かく定義しなくても、データそのものから話題のまとまりが立ち上がります。そのため、想定していなかった不満や期待といった論点が、探索的に見えてくることも少なくありません。

これにより、自由記述から生活者が何を感じ、何を求めているのかを、より直接的かつ立体的に捉えられるようになります。

大規模言語モデルを活用したトピックモデリング

前章でご紹介したように、AIの発展により、自由記述は「単語の集まり」ではなく、「意味を持った文章の集合」として扱えるようになりました。

その代表的な活用方法が、大規模言語モデルを活用したトピックモデリングです。

トピックモデリングとは、大量の自由記述データをもとに、生活者が何について語っているのかという“話題のまとまり(トピック)”を抽出する分析手法です。

従来は、分析者が一つひとつ回答を読み込み、「これは価格の話」「これは品質の話」と人手で整理する必要がありました。

大規模言語モデルを活用したトピックモデリングでは、似た内容の文章同士を自動的にグルーピングします。その結果、数千件・数万件の自由記述であっても、全体をいくつかの主要なテーマに整理することが可能になります。

トピックモデリングの概要

大規模言語モデルを活用したトピックモデリングは、大量のテキストデータを入力すると、人がすべてを読まなくても、主要な論点を構造的に把握できる仕組みです。

これにより、

・膨大な顧客の声から、全体像や大きな論点を把握する

・表現の違いに左右されず、共通する課題やニーズを浮き彫りにする

・想定していなかった不満や期待といった、新たな視点を発見する

といったことが容易になります。

トピックモデリングは、自由記述を「読む作業」から「構造を理解する作業」へと変えるアプローチだと言えます。

トピックモデリングのアウトプット

大規模言語モデルを活用したトピックモデリングでは、分析結果を理解・活用しやすくするために、主に以下のようなアウトプットが得られます。

テキストマップ

文章同士の意味的な近さをもとに配置したマップです。似た内容の回答ほど近くに集まり、顧客の声がどのような話題の塊を形成しているのかを直感的に把握できます。

以下は、弊社の独自調査「購買行動におけるAI浸透度調査」の自由記述回答を処理した例です。

設問:あなたは、AIに対してどのような期待や不安を持っていますか。何でも結構ですので、あなたの考えを、なるべく具体的にお知らせください。

▼テキストマップイメージ

トピックの割合の可視化(棒グラフ)

抽出された各トピックが、全体の中でどの程度の割合を占めているかを可視化します。

これにより、「どの論点が多く語られているのか」「相対的に影響の大きい課題は何か」といった規模感の把握が可能になります。

▼棒グラフイメージ

AIによる自動要約・ラベリング

各トピックに含まれる文章群をもとに、AIがその内容を要約し、トピックを端的に表すラベルを自動生成します。

従来のように担当者がすべての文章を読み込み、トピック名を考える必要がなくなるため、分析から示唆抽出までのスピードを大幅に高めることができます。

要約イメージ

TOPIC 04 : AIの利便性と情報確認の必要性

要約:AIは質問に対して迅速に回答を提供してくれるため、非常に便利だと感じる一方で、その回答の正確性や信頼性に対する不安が多く挙げられています。特に、間違った情報や曖昧な回答が含まれることがあり、利用者はその情報を鵜呑みにせず、他の方法で確認する必要があると感じています。また、質問の仕方や使い方によって回答の質が変わるため、適切な使い方が求められます。AIの利便性を享受しつつも、情報の信頼性を見極めることが重要だと考えられています。

TOPIC 10 : AIの社会浸透と仕事への影響

要約:AIが社会に浸透することに対して、多くの人が不安を感じています。特に、AIが人間の仕事を奪うことや、AIによる管理・支配の可能性に懸念が寄せられています。また、AIが暴走したり、情報漏洩や著作権侵害などのリスクも心配されています。一方で、AIが生活を便利にし、ストレスの多い仕事を代行してくれることへの期待もあります。全体として、AIの進化とその影響に対する不安と期待が交錯しています。

なお、こうしたトピックモデリングは、汎用的なツールを操作するだけで自動的に得られるものではなく、Pythonを用いた前処理・モデル設計・結果検証を含む一連の分析プロセスを通じて初めて実現しています。

トピックモデリングの結果解釈例

例えば、分析の結果、“AIに対する意識”は大きく次の4層に整理されます。

「AIに対する意識」についてのトピックモデリングの解釈例

(1)利便性・効率化への期待・・・AIを仕事や生活を支える存在として捉える一方、正確性の確認を前提とする慎重な姿勢。「使いたいけれど、完全には任せない」

(2)誤情報や判断ミスへの不安・・・真偽判断の難しさや誤情報への具体的なリスク意識。「便利でも、信用しすぎるのは危険」

(3)社会・倫理・雇用への懸念・・・個人利用を超え、社会全体への影響を見据えた視点。

(4)距離を置く層(未経験・無関心)・・・期待も不安もまだ具体化していない層。

この結果は、AIが単語の頻度ではなく、文章の意味の近さで回答を整理したからこそ得られた構造です。

「(1)利便性・効率化への期待」のように、従来の単語ベース分析では見えづらかった「期待と不安が同時に語られる構造」が明確に浮かび上がったことが特徴的です。

トピックモデリングは、「AIへのポジ・ネガ」という表層的な二分ではなく、どのような前提や文脈で語られているのかを明らかにする分析手法だと言えます。

AI浸透期の生活者理解や施策設計において、この“構造を読む”視点が欠かせないことを示す例になります。

AI時代の自由記述分析なら、電通マクロミルインサイトにご相談ください

トピックモデリングによって明らかになるのは、「どんな意見が多いか」ではなく、「どのような考え方の塊が存在しているのか」です。

AIによる意味ベースの分析は、期待と不安が同時に語られる文脈や、少数でも重要な論点といった、従来のテキストマイニングでは捉えにくかった構造を可視化します。

電通マクロミルインサイトでは、分析結果をそのまま示すのではなく、調査の目的や背景を踏まえながら、活用しやすい形で整理・解釈することを大切にしています。

AI時代の自由記述分析なら、ぜひ電通マクロミルインサイトにご相談ください。

執筆者|株式会社電通マクロミルインサイト データソリューション部 データアナリティクスグループ
調査設計から分析・レポーティングまで一貫して支援し、複雑化するビジネス課題に対し解析視点から実践的なインサイト創出を担う専門チーム。

 


関連コンテンツ

マーケティング分析の具体的な手法とは?成果を出すための手順と活用できるフレームワークを紹介
マーケティングプロセスとは?基本の考え方を徹底解説
4P分析とは?マーケティング戦略における特徴や事例、4Cとの違いを解説
マーケティングのフレームワーク・手法15選と頻出用語
STP分析とは?マーケティングの基礎知識と成功させる手順を解説
5フォース分析 (ファイブフォース分析)とは?進め方や業界別の事例
ポートフォリオ分析のやり方は?事業成長を導くフレームワークを解説
アンケート結果を集計する方法|それぞれの特徴やポイントは?
クロス集計とは?分析・集計方法やメリット、やり方の注意点などを解説
ソーシャルリスニングとは?活用例やメリット、注意点についてリサーチ会社が解説
AIDMAとは?AISASとの違い、意味やポイント、類似モデルについて解説
セグメンテーションとは?マーケティングにおける位置づけや、変数、分類法についてリサーチ会社が解説
ポジショニングとは?マーケティングにおける位置づけや6つの基準、注意点など解説
ターゲティングとは?重要性、マーケティングにおける位置づけ、6つのポイントを解説
3C分析とは?顧客・競合・自社を見極める戦略フレームワークの活用法
SWOT分析とは|意味や目的、進め方のポイントは?リサーチ会社が解説
テキストマイニングとは?自由記述式設問の分析入門

CONTACT マーケティングリサーチに関する
ご相談・資料請求はこちら