目次
大量の情報をどのように分析するのか。それはビッグデータという言葉が囁かれるようになってからは、大きな課題として注目されています。
クラスター分析は、ビッグデータの中でもOne to oneマーケティングに用いる分析手法としては最もよく使われる手法の1つです。
多くの情報があるなか、顧客視点にたち本当に必要な情報を提示するには、どうしたらいいのか。
クラスター分析をすることで、データを全体をグループ分けすることで浮き出る、思いもしないデータ同士の共通点や性質に出会える可能性があります。
そんなクラスター分析の基本から、具体的な手法までご紹介します。
クラスター分析とは
異なる性質の集団の中から、似た性質のものを集めてクラスターを作る手法のことをクラスター分析といいます。
ちなみにクラスターとは、英語で「房」「集団」「群れ」を表す単語です。
このクラスター分析は、年齢や居住地などはっきりした区別ではなく、はっきりしないデータを分類する場合に用いられます。
分類する時の基準は、データ同士が「似ているか」「似ていないか」で、最終的には類似性の高いデータ同士がクラスターになります。
それはどのようなデータなのか、次に例をあげてみました。
クラスター分析でできること
例えばスーパーの市場調査をクラスター分析するとします。するとこんな分類ができます。
- 顧客層の特性ごとに分類する
- 店舗の取り扱い商品ごとに分類する
- 商品の種類ごとに分類
- 取引先の取引履歴をもとに分類
一般的な集計で性別や年代などの分類から1人あたりの平均購買価格を提示することはできます。
ですが、実際にその分類だけで得られる情報では、売上に貢献してくれる層や、販路拡大の鍵となるターゲット層は絞り出せません。
クラスター分析では、顧客タイプを分析しターゲット層を絞り出し、さらにはそのターゲット層にヒットするキャンペーンや、そのマーケットを分析することで競合との差別化を図ることができます。
クラスター分析の種類
クラスター分析には次にあげる2種類の手法が存在します。
階層的手法
まず一つ目は「段階的手法」と呼ばれるものです。
これはデータとデータの「類似度」によって分類しデータを併合していく手法です。
この「類似度」とはデータとの「距離感」であり、その距離の測定方法はいくつかあります。
- 最短距離法(距離の近いものから順に併合)
- 最長距離法(距離の遠いものから順に併合)
- 重心法(重心からの距離をもとに併合)
- ウォード法(平均からの偏差値をもとに併合)
どの手法を選ぶかは、分析したデータの導き出したい結果に基づいて選ぶことになります。
ちなみに一番よく使用される手法は「ウォード法」で、データ全体がバランスよく分類されやすいからです。
段階的手法は、樹形図(デンドログラム)と呼ばれるトーナメント表のような図で視覚化できることができ、結合されていく課程を確認しながら情報を判断しやすい事がメリットと言えます。
ですが、あまりに情報量が多い場合は結果の解釈が難しいため、次にあげる「非階層的手法」が選ばれます。
非階層的手法
この「非段階的手法」は、事前にクラスター数を決めておき、似たようなパターンを持ったサンプルを同じグループに属するよう自動でグルーピングするアルゴリズムのことです。
その代表的な手法として「k平均法」があり、サンプルを k 個のクラスターに分けるアルゴリズムです。
これは事前に指定したクラスターの数だけ「重心」の位置がランダムに設定され、その「重心」からの距離をサンプルごとに計算します。
この非階層的手法のメリットとしては、階層的手法のように全てのサンプル間の距離を計測する必要がないため、情報量の多いビックデータを扱う際に適した手法です。
二つの手法を使い分ける
「段階的手法」と「非段階的手法」では特徴が異なり、方法や解釈の仕方も変わってきます。
扱うデータの応じて、どちらの手段を使うべきか判断が必要になってきます。
line/col | 段階的手法 | 非段階的手法 |
---|---|---|
クラスター分けしたい対象の数 | 少ない場合に◯ | 多い場合に◯ |
クラスター数を決めるタイミング | 分析後 | 分析前 |
メリット | デンドログラムで結合の過程を見ながら判断できる | ビッグデータを扱いやすい |
デメリット | 対象が多い場合、解釈が難しくなる | 分析前にクラスター数を決める必要がある |
判断基準を簡単に表にまとめたものが上記になります。
これらを参考に、扱う対象からどちらの手法が適切か判断してみてください。
クラスター分析を行う
ここではクラスター分析を進める手順を、追って例をあげながら説明していきたいと思います。
クラスター分析を行うにあたって、大事なのは解析を行う前の事前準備と、解析後の解釈です。
その点を念頭に置きながら進めてみましょう。
1.調査背景
アパレル製品を展開するAという会社あったとします。A社では店舗販売だけでなくオンラインショップも運営しています。
新商品の発売やセール情報をDMでお知らせしたいと思いますが、扱うブランドはレディースで年齢層は20代〜40代向けのカジュアルウェアです。
必要な情報が必要な人に届くようにしなければ、DMの効果を得ることはできません。
そこで顧客のクラスター分析を行い、それぞれにあったDMを作成し送ることにしました。
2.調査手順
データ分析は、ポイントカードやオンラインショップに登録された顧客情報と、購買履歴をもとに行うことにしました。
分析する手法は、3,000人以上の会員のデータと量が大きいため、非階層的手法でk-means法でエクセル統計のソフトを利用し解析することに。
最初に設定したクラスター数は、レディースで年代ごとに3種類程度を想定して3つで設定しましたが、結果を試してみたところ分類は5種類にするのが効果がありそうだとわかりました。
3.各クラスターを解釈
分析結果結果でわかったのは5つに分類するということです。どういった内容で分類するかまでは、統計ソフトは示してはくれません。
そのため、それぞれのクラスターの見極めて特性を解釈すると、以下の5つの分類に分類することができました。
- 新商品を購入したい層
- セール品を購入したい層
- 定番アイテムを購入する層
- 流行アイテムを購入する層
- お試し買い層
この顧客層に分けられると、どういった情報を必要とされているのかが、少し見えてきまね。
4.分析結果を活用
クラスター分析でわかった5つの分類から、5種類のそれぞれのターゲットに必要な情報をDMにして作成して送ることになりました。
対象者がわかるだけで、求められる情報がわかるためDMの作成も容易になります。
クラスター分析を行う場合の注意点
ここで、クラスター分析における注意点を確認しておきましょう。
客観的ばかりではない
これは非段階的手法に特にあてはまることですが、非段階的手法の場合前述の通り事前にクラスター数を設定する必要があります。
この設定値によって結果が大きく変わることがあることを、否定できません。
また解析結果は分析する人の考えも含まれるため、100%客観視できているとは言い切ることができません。解析者によって違う答えを導き出すことも、大いにありえるからです。
他の手法と併せることが大切
クラスター分析は、あくまでも「分類する」ということです。
その分類がどういった法則や理由で導きだされたかはわかりません。
そのため他の分析方法も併用し、多角的に判断することが求められます。
クラスター分析をエクセル統計で
クラスター分析は、複雑な計算を行うためエクセル単体では難しく、統計ソフトが必要になります。
それが「エクセル統計」というソフトになります。
エクセル統計とは?
「エクセル統計」ソフトをインストールすると、メニューバーの中にエクセル統計のタブが現れます。
そこから解析を進めることができるため、エクセルデータを利用することができます。
日本製の解析ソフトでは、国内シェアNo.1を誇る製品で、ユーザーサポートも日本語で対応してくれます。
エクセル統計を使うメリット
「エクセル統計」意外にも統計ソフトは存在します。フリーソフトウェア「R」や、IBMが発売する「SPSS」がそれにあたります。
ただエクセル統計は、エクセルのアドインソフトのため、使用方法が比較的使用しやすい点は大きなメリットになります。
クラスター分析の事例
クラスター分析は実社会において、どのように活用されているでしょうか。
例えば、前述の「クラスター分析のやり方」で説明したようなDMの送付や、アンケートを解析し新商品開発、販売実績を解析しセット商品の考案など、ビジネスにおいて活用の幅は広がります。
クラスター分析上手く活用し、情報を可視化し今後の販促戦略の考案に役立ててみてください。
いいね!
この記事をシェアする
この記事を書いた人
すべらないキャリア編集部
「ヒトとITのチカラで働く全ての人を幸せにする」というミッションのもと、前向きに働く、一歩先を目指す、ビジネスパーソンの皆さんに役立つ情報を発信します。