catch-img

拡張分析でPOSデータからどのような知見を発見するか?


目次[非表示]

  1. 1.データ分析の中心であったPOSデータと、それを活用する業界
  2. 2.POSデータを分析する際の主な手法について
    1. 2.1.RFM分析
    2. 2.2.時系列予測
    3. 2.3.アソシエーションルール
    4. 2.4.要因分析・仮説発見
  3. 3.POSデータ分析におけるBIツールと拡張分析ツールの違い
  4. 4.BrainPad VizTactが貢献できる事

データ分析の中心であったPOSデータと、それを活用する業界


 多くの企業、特に店舗を保有している企業においては POS(Point of Sales) システムを導入し、このデータを分析する事で売上の状況を知り、意思決定を行っていました。POSデータでは、いつ、どこで、何が買われたかがわかるため、商品の売れ筋分析、ブランドや商品の顧客からの支持率調査、店舗における棚割りや商品構成の検討、需要予測を行い在庫のコントロールを行うためのデータとして広く活用されています。

今でこそ、ID POSが増えているため、誰が購入したかを知ることができるようになっていますが、過去には店舗型の小売流通業では顧客を識別するための方法はありませんでした。”顧客フロー”産業として主にレシート情報とそこに記載されている商品情報を活用して、商品構成や店舗の状況を細かく把握するために活用されていました。(レジで店員の判断などで世代と性別を入れて属性を知る試みが行われていました)

また、顧客に直接販売をしていた店舗型の流通業だけではなく、メーカーや卸売業にとっても自社商品の売れ行きや地域特性、競合他社との比較を行うことが重要となります。自社で販売を行っていない卸売業やメーカーは、データを保有する流通業や、リサーチ会社からPOSデータを購入して分析を行ない、自社のデータと統合して活用しています。

POSデータは「Point of Sales」と言われる通り、「販売時点情報」のスナップショットの連続であり、時系列に大量に発生しているログのようなデータです。これらのレコードの「行」と「行」には関係性はありませんが、データ加工、集計の仕方により意味を持たせて店舗運営・商品企画・施策に役立つデータに仕立て上げていく必要があります。


POSデータを分析する際の主な手法について


 POSデータは非常に大量に発生するために、RDBMSなどに蓄積され、様々な方法で集計・レポートが行われています。最も多い使われ方としては、BIツールで年月日、地域、店舗、商品の分類で集計してレポート、グラフを見る方法です。これらは時系列に各商品や店舗の変化を見ていくことで、商品の季節性の分析や、店舗での売上の動向から地域特性などを知ることが可能となっています。

以下では、POSデータを使って行われている分析手法をいくつか紹介します。


RFM分析

 RFM分析は”デシル分析”と合わせて、POSデータだけではなく履歴データを用いた分析の中で最も行われている手法の一つと言えます。Recency、Frequency、Monetoryの3つの軸で集計を行い、頻度、回数、金額の3点の軸でシンプルに見分けられるため、非常に広く活用が進んでいます。

RFMはシンプルな方法で使いやすいですが、この手法の起源はアメリカの通販企業で、カタログコストを削減するため、「RFMの値が一定量に満たないものはカタログ送付と止めて切り捨てる」というコスト削減のための手法でした。

そのため一定の基準以下の顧客を切り捨てコスト削減するというシンプルなものでしたが、現在では「良い顧客」を拾うための目的が強くなっています。ただ、その場合はRFMのその閾値を決めなければならなかったり、回数が多く・頻度が高い顧客にターゲットが集中してデータが徐々に偏っていくなど、運用方法での難しさも出てきています。


時系列予測

 近年、成長市場ではない日本において、売上ではなく、利益を確保するために「不良在庫の圧縮」と「品切れによる機会損失」の両面を適切にコントロールするために、将来の需要を的確に把握するために「時系列予測」および「需要予測」のニーズが高まっています。POSデータを利用し、折れ線グラフでのトレンドを見るような方法や、統計的なARIMA・X12など季節性・トレンド・周期性などを発見する手法を用いて統計的な変化を予測していく手法などが存在しています。

時系列データを使った予測は、全国、店舗別、地域別、商品別、、、などさまざまなレベルで予測が行われます。ただ、様々な特殊事情、季節性のイベント、大規模施策、商品改廃などにより、売上の連続性や変動に周期性が無く、またノイズの除去などが難しく、実務への適用は補正ロジックなど慎重に考え必要があります。


アソシエーションルール

 POSデータを活用した最も有名なデータマイニングツールの逸話として「ビールとおむつ」のような事例があります(実はこの例、真偽はさだかではありません)。莫大な購買情報の中に発生している、POSのレシート単位の組合せから、信頼度、支持度、、、などの様々な値から、併売されやすいパターンを発見する手法です。

データマイニングの基本機能として実装され、以前は ”Apriori” などのアルゴリズムが多用されていましたが、商品数が莫大になり、ロングテールの商品に対してのレコメンドが必要となり、最近はグラフ理論など、様々な手法が活用されています。


要因分析・仮説発見

 今回の「拡張分析(Augmented Analytics)ツール」のメインとなる役割はこの部分となります。上記のような分析手法から、さらに”洞察”をデータから素早く得るための活用方法となります。ポイントは、「誰でも、簡単に、統計的な手法を使い、分かりやすい知見を発見や、キッカケをつかむ」という事になります。

BIを活用すると、「Aエリアは土曜日の16時ごろに売り上げが伸び、Bエリアは水曜日の18時ごろに売り上げが伸びる」などの結果がすぐにわかります。そうするとこの時間帯を頭に入れ、仕入れ、人員体制の計画などを立てると思います。しかしながら、「”Aエリア” と”Bエリア” でのこの売上の違いの要因は何か?」が重要なポイントになります。このポイントを知ることができれば、より適切な施策、品ぞろえ、対策が打てるかもしれません。

このような時に分析者は「これだ!」という確信を持てるルールを持っておらず、データから探し出す必要があります。しかしながら、その作業には骨が折れてしまうため、拡張分析の出番となります。様々な店舗に関連する情報、エリアの情報、天候の情報を投入し「AエリアとBエリアの違いは、駅からの距離とエリアにおける人口統計上の家族構成と年齢による違いが要因として挙げられます」とツールから発見された仮説が自動で出てくれば、対策が打ちやすくなり、より深堀分析のためにフォーカスを当てることができます。このように人の経験や勘で探索してたどり着く ”気づき” を、AI・機械学習で補完し、効率的に発見してくれるのが”拡張分析(Augmented Analytics)”となります。

拡張分析(Augmented Analytics)の ”拡張” とは、人の” 気づき” の能力を”拡張”してくれることにあります。AIを人の代わりではなく、人の補佐として使うというのがポイントです。


POSデータ分析におけるBIツールと拡張分析ツールの違い


 POSデータを利用する場合、BIツールと拡張分析ツールでは、似たような企業は多いですが、その目的やデータの特徴などが異なります。まとめると以下のようにまとめられると考えております。


BIツール

拡張分析ツール
目的と用途
ユーザーの見たい角度で自由にデータを閲覧し、レポーティング、グラフを作成し、今の状況を把握することができる。
今まで知らなかったルールをデータから発見する。多くの項目で複雑性を持つデータから、ユーザーが知らないルールや知見を素早く発見する。
操作性と作成
POSデータなどは、年月日、店舗、商品、金額などの項目を、そのまま投入すればユーザーが見たい角度でレポートを作成可能。ビジュアルも自由に配置し、ユーザーがダッシュボードを作成を行う。
データを投入すれば、売上、気温、商品などに関して、データの項目間の関係性など、ツール側でルールを発見してくる。ある程度、ルールを発見可能な状況にするためのデータを作る作業が必要。
ビジネスへの応用
様々な経営や店舗運営の管理のための必要な情報を取得し、現状把握、管理のための情報を取得する。主には過去データの実績把握、モニタリング。
新しいアイディアや、要因、「何が同関連している?」に対して、データから新しい発見、知見を見つけ、新たな施策に結び付けられる。
データの件数
会社やビジネス規模全体の状況を理解し、正しくデータの“合計値”を出す必要があるため全件の膨大な処理が必要。
データから傾向を知る必要がある場合は “平均値” が重要であり、傾向を知るためにはサンプリングで十分信頼ができる場合が多い。統計的な複雑な計算を行うため、全件では膨大な時間がかかるため、サンプリングデータでも十分。



上記のようにBIツールと拡張分析ツールは似たように思われますが、その目的、機能、アプローチ、データの使い方などは大きく異なります。例えば、BIツールの場合、POSデータであれば、履歴データをある程度加工してそのまま投入すれば、実績のレポーティングでの活用は問題ありません。

ただ、拡張分析では、例えば、店舗間での売れ筋、顧客層の違い、外部要因の変化を見たいという場合には、以下のような項目に変更し、必要な項目で集計項目などを作成しておくことが重要となります。アイディア次第ではもっと沢山のデータを投入することが必要となります。



例えば、上記の項目にさらに月別、店舗別の来店客数、エリアの天気予報、気温などの情報や、地域エリアの人口統計情報、店舗の広さや、駐車場の数、競合店からの距離、、、などの情報を店舗に紐づけて様々なルールの発見に挑みます。

上記のようなデータを準備し、拡張分析を活用することで、漠然とは気になっていたが、具体的な条件として気づきにくかったような具体的な数値やルールなどを発見することができます。

  • 曇りの日来客数は晴れより平均何名少ない
  • 全体売上に一番影響するのはXXカテゴリの売上の変化であった
  • バナー広告のコンバージョンが高まるのは、Interestが旅行の人だった

このように書いてしまうと単純に見えますが、数万行、数十項目、各項目に数十種類の値が入っている場合、これらのルールにたどり着くには非常に時間がかかってしまいます。そして、たいていの場合はたどり着けずに、その場で考えられたルールで分析を終えてしまいます。


BrainPad VizTactが貢献できる事


 今回のテーマであったPOSデータだけでなく、企業が持つその他の顧客情報、施策情報、Web閲覧ログ、SNSデータなど、多くのデータを旧来のPDCAの手法で分析を回すと、MAやソーシャルで行われている施策実行に追いつかなくなります。

高速に回されていくビジネスや状況の変化にに追随・対応し、不完全な状況で合っても結果を出し続けるような分析の仕組みが必要となります。それが変化に追随する、「クラウドネイティブな環境」、「Agileな開発手法」、そして「拡張分析による高速な分析とGrowth Hack」であると言えます。

このような状況において、データを準備・投入し、機械学習の手法で素早くデータに潜むルールや知見を発見するだ必要があります。また、その際には知見を言語化・視覚化をして説明させ、理解し、新しいアイディアをさらに施策に生かしていくという必要があります。

”BrainPad VizTact” はこのような変化の激しい状況において、ビジネスユーザーが素早い意思決定サイクルを回していくための、新しいSaaS型のアナリティクスソリューションです。ビジュアル分析と、機械学習の結果の分かりやすい表示、分析結果を自然言語として提示し、深い統計的な訓練を受けていない一般的なビジネスユーザーであっても、データから知見を得る事を支援しています。

社内にある沢山のデータを単なるレポーティング・グラフ化だけでなく、一歩進んだ分析を、多くの社員に共有させたいというニーズが高まっています。”BrainPad VizTact” はまさにそのような時に簡単に試行し、分析を行っていけることを目標として開発をしております。

是非、このようなデータ活用を目指す方が単は、機能の詳細などを、セミナーやWebでご確認いただき、お問い合わせをいただければ幸いです。