第12章 マーケティング・リサーチと解析手法

[データの基本3] 度数分布と特性値

各質問の選択肢別に集計したサンプル数の分布が度数分布。そこから導き出される分布の特性を示す値が特性値。

度数分布とは
 一般的には、各質問の回答を選択肢別に集計したサンプル数を指します。量的データ(例えば金額)の場合は、データを適当な幅でいくつかクラス分けし、各クラスの対象数を数えたものを指します。度数分布は集団の量的構造を把握するための基点です。量的構造をさらに把握するために、分布をグラフ化したり、特性を算出したりします。「特性値」とは、度数分布の特性を表す値のことをいい、中心を現すものに「平均値」「中央値」、分布の拡がり程度を表すものに「分散」「標準偏差」といったものがあります。以下では「平均値」と「中央値」を取り上げて説明します。

平均値
 平均値は、@算術平均、A幾何平均、B加重平均に大別されます。
 @算術平均とは、個々の量的データの総和をそのデータ個数で割った値を指します。通常、平均値はこの算術平均を意味します。A幾何平均とは、個々の量的データを全て掛け合わせた積を、そのデータ個数で開いた根を指します。連続する「対前年比」の量的データの年平均を計算する場合は、幾何平均で計算した方が合理的です(複利式の考え方)。B加重平均とは、元の個々のデータにその重要程度に比例した係数(ウエイト)を乗じて計算する方法を指します。評価質問や満足度質問といった場合で多く使われます。平均値は、計算が簡単なので中心を表す特性値の代表として最もよく使われています。ただし、年収や年齢のように、一般的に分布が非対称の場合は、分布中央から離れてしまう特性を持っているので、そのような場合は中央値を使う必要があります。

中央値
 中央値とは、集団に含まれる個々の量的データを大きさの順に並べた時に、中央にくるデータの大きさ指します。中央値は、平均値に比べて分布状況の影響が少なく、安定性に優れています。