R&Dラボ便り

ベイジアンネットワークとマーケティングリサーチ

執筆者:日本リサーチセンター R&Dラボ
奥城健太郎

ベイジアンネットワークとは、確率モデルの構造を視覚的に分かりやすく記述したグラフィカルモデルの一種で、複数の変数間の依存関係を確率推論によって可視化したものです。1980年ごろから人工知能分野で研究が進められ、近年、コンピュータの性能の飛躍的な上昇によって、大規模なネットワークの処理が可能となったことから、広く活用されるようになりました。マーケティング分野でも、消費者行動を視覚的に理解できる方法として注目を集めています。

今回のR&Dラボ便りでは、ベイジアンネットワークの仕組みを簡単に解説し、マーケティングリサーチにどのように活かせるのか、事例を交えてお話ししたいと思います。

ベイジアンネットワークとは何か

 ベイジアンネットワークは、変数から変数に矢印が引かれた有向非巡回グラフ(注1)で表されます。各変数をノード、ノード間に引かれた矢印をリンクといいます。また、リンクの元にあるノードを親ノード、リンクの先にあるノードを子ノードといいます。ベイジアンネットワークの特徴として、各ノードの値が確率変数となっており、値に対して確率が割り当てられていること、また、その確率がベイズの定理を用いて求められることがあげられます。図1をご覧ください。

図1.ベイジアンネットワークの構造

子ノードの確率は、あらかじめ決められた事前確率と親ノードの確率によってのみ決まるので、複雑なモデルになったとしても比較的簡単に各ノードの確率を求めることができます。

 また、条件付き確率となっていることから、あるノードの確率を変更したとき、そのノードとリンクでつながっている別のノードの確率も変化します。このことによって、観測された情報(確率)をノードに代入して他のノードの確率を推定するといった、ある種のシミュレーションを行うことができます。

 以上のことをまとめると、メリットとして以下の2点が挙げられます。

・モデルが、視覚的にわかりやすいグラフ構造で表現できる。
・それを用いたシミュレーションが行える。

(注1)有向非巡回グラフとは、ノードとノードが向きのついたリンクでつながれており、リンクの向きに合わせて複数回ノードを移って同じノードに戻ってこないようなグラフ構造をいいます。

ベイジアンネットワークを用いた分析例

ここではNTTデータ数理システムの「BayoLink(http://www.msi.co.jp/bayolink/ )」というベイジアンネットワーク構築支援ソフトを用いて実際に分析を行った事例を紹介します。このソフトは、ベイジアンネットを自動構築、確率推論などの機能をサポートしており、初学者でもGUIベースの操作で、直観的にベイジアンネットで分析をすることができます。

今回は弊社で行った映画に対する自主調査のデータを用いて分析を行います。変数としては次のようなものを使いました。

・年代や性別などの属性データ
・映画を見たときの状況
・映画に対する期待
これらのデータから、属性・状況と映画に対する期待のつながりを分析します。ここでは、変数の一部を抜粋して分析を行いました。

自主調査データの概要
・件名:R&Dラボ/ナレッジライブラリー自主調査
・調査手法:web調査(サイバーパネル100%)
・実施時期:2018年11月27日~12月2日
・サンプル数:1122s
(そのうち、「3年以内に映画館で映画を見た」と回答した556sを分析に用いました)

図2.シュミレーションの様子

図2はBayoLinkを用いて描いたもので、あるノードの確率値を変化させたときの他のノードの確率値を確認することができます。3つのノード間に2つのリンクが引かれ、リンクが繋がれたノードの間に依存関係があることが分かります。ここからがベイジアンネットワークの魅力なのですが、ノードに割り当てられた確率を変化させることで、その他のノードの確率を推測することができます。

 では、これを用いて、あるノードの確率値を変化させたときの他のノードの値を見ていきます。

 図2より、映画に対して熱くなることを期待していた確率を1としたとき、リンクで繋がったノードの確率値が変化していることが分かります。映画を見る前にテンションがあがっていた確率と年代が20代・30代の確率が上昇していることから、テンションがあがっている若者が、映画に対して熱くなることをより期待していることが分かります。

 マーケティングの観点でのメリットは、今回の分析の2つ目の例で言えば、共感できる人を8割までに高めるためにはどういう人をターゲットにすればよいか、といったシミュレーションができます。

ベイジアンネットワークとマーケティングリサーチ

 ベイジアンネットワークでは、変数間の依存関係を視覚的に分かりやすく表現できます。そのため、ニューラルネットワークなどの機械学習モデルが、モデル内容の解釈ができないブラックボックスと呼ばれているのに対して、ベイジアンネットワークは解釈が容易なホワイトボックスと呼ばれています。マーケティングリサーチでは、結果を予測することではなく、過程の解釈が重要となってくるため、ホワイトボックスであるベイジアンネットワークが、分析により適していると言えます。

 また、マーケティングリサーチは仮説が重要とされています。ベイジアンネットワークでは、データ構造を自動学習して機械的に初期モデルを作れますが、リサーチャーやマーケッターがデータを流し込んで仮説を検証したり、不足しているデータへの検討を深めたりする使い方もできます。

 先の例で言えば、モデルをシミュレーションしながら、関係者で議論してマーケティング施策を一緒に考える、といったことも可能になります。


●Q&A

Q.推論の誤差はどのように考えれば良いのか
A.ベイジアンネットワークでは、データで推論して実際のデータとの適合を見ます。一般的な推測統計学と異なり、得られたデータがある母集団から生成されているという考え方をとりません。得られたデータは不変と考え、そこから変わりうる母数を推測しています。

Q.モデルの評価をどのように行うのか
A.ML(最大対数尤度)やAIC(赤池情報量基準)を用いて相対的に評価を行います。また、学習させていない未知のデータにモデルを当てはめて、妥当な確率値となるかどうかでも判断をします。

Q.どのようなロジックでリンクが引かれているのか
A.手法としては大きく分けて2つあります。ひとつは、リンクのつながりを全パターン計算して、その中でモデルの評価が最もよかったものを採用する方法です。この方法は、最適なモデルが確実に見つかる反面、ノード数が増えると計算量が爆発的に増えていくという難点があります。そこで、もうひとつの方法としてあげられるのが、近似的にモデルを求める方法です。近似解の求め方として、リンクを引いていない状態からAICを見てリンクを追加していく方法(Greedy Search)と、リンクをすべて引いた状態からAICを見てリンクを削除していく方法(Stingy Search)の2種類があります。

Q.リンクを人為的に追加で引くことはどういうことなのか
A.ベイジアンネットワークのシミュレーションは、仮説の探索だけでなく仮説の検証に用いることができます。その場合、分析者自身で立てた仮説に合わせてモデルを修正してシミュレーションを行った方がより的確な解釈ができます。
また、自動で作成されたモデルは学習データにフィットする形で作成されています。そのため、未知のデータをモデルにあてはめる際には、自動作成されたモデルが必ずしもよくあてはまるとは限りません。

お問い合わせ窓口

株式会社日本リサーチセンター
担当:広報室
お問い合わせ専用Eメール information@nrc.co.jp

お問い合わせ