BLOG
ブログ記事一覧

catch-img

注目される "スモールデータ分析(Small Data Analaytics)" の世界と拡張分析(Augmented Analytics)



ビッグデータとスモールデータ


 現在の企業を取り巻くデータは、企業内のERPから発生する顧客や取引に関するデータ、さらにはデジタルマーケティングで発生するアクセスログ、操作ログ、メールの開封データ、さらにはSNSや広告に関連するシステムなど非常に多くのデータであふれています。

これらは「ビッグデータ」として扱われ、機械学習などのテクノロジーと組み合わせ様々な用途に使われています。しかしながら現在では、よりコンパクトでハンドリングしやすい「スモールデータ(Small Data)」の活用が注目されています。

「スモールデータ」とは人間が理解するのに十分な大きさの小さなデータです。またこれらのデータはアクセスが容易で、有益であり、アクション可能な形式のデータであると定義されています。(Wikipedia)

一般的に「ビッグデータ」の解析では、大量のデータから”意思決定の自動化”のためのスコアや、様々な状況の判定などのために、分類モデルを構築し、画像の判定や、マーケティングの予測などを活用されます。よって、不正が検知できれば良い、顔の判定ができれば良いなど、機械的な判定を行う事に優れています。

ではビッグデータから状況を理解したいと思った場合、どのような分析を行うでしょうか?たいていの場合、そのデータをフィルタし、サマリーし、セグメント化し、グラフやクロス集計などなるべく単純化して、理解可能な小さな次元に落とし込んでいるはずです。

このことからわかる通り、意思決定の自動化のためにビッグデータと機械学習は非常に有用ですが、要因・パターン・理解可能なルールを見つけるのは、スモールデータの役目となります。これらのスモールデータはアクセスしやすく、ハンドリングしやすく、企業内のどこにでも存在し、ExcelやCSV(か、それらに近い形のデータ)で存在しているはずです。これらのスモールデータに対する分析は、洞察をすべての人に展開し、理解しやすく、利用しやすく、日々のタスクに焦点を当ててアクションを可能にすることを重視します。

しかしスモールデータといえ、項目数が10や15を超えたあたりから組み合わせは非常に複雑になり、単なるピボットテーブルや散布図では全容を把握し、有用なルールを発見することは容易ではない為、適切なツールやシステムが必要になります。


目次[非表示]

  1. 1.スモールデータの活用とそのメリットは
  2. 2.スモールデータの活用と拡張分析(Augmented Analytics)

スモールデータの活用とそのメリットは

 ビッグデータは時にその量と規模が過剰なほど大きくなりますが、実際に使われているデータはごく一部のレコードや、項目であり、その他の項目は単に蓄積されているだけの場合があります。しかしながら必要になった場合に備え、粒度が細かいデータがそのまま保存することで、データマイニングや機械学習で役に立つことがあります。ビッグデータはその蓄積コストに対し、いかに活用して収益に結びつけていくかがキーとなっています。

これらのビッグデータはデータサイエンティストだけのものだけではなく、フィルタをかけ切り出し、スモールデータにして社内で活用することでその存在意義を高めることができます。実際にビジネスで必要とされるデータにフォーカスを当て、企業が必要とするリソース、スキルのレベルに合わせて活用し、莫大なデータハンドリングへの過剰なコストを避けることができる可能性があります。

では、スモールデータのメリットはどのようなことでしょうか?

一つ目に上げられるのが、正確な「全体の総合計金額・件数」ではなく、傾向や要因、パターン、パーソナライズのためのルールを知るためであれば、サンプルで十分であり、データ項目間の相関関係、ルール、パターンの発見にフォーカスを当てればよいという事です。ソーシャルのデータなど、世の中の投稿全てを知らなくても、製品やブランドのターゲットである期間、地域、言語、属性のサンプルデータを理解するれば十分である場合が多いと考えられます。

もう一つはコストです。1億件ではなく、10万件のデータでも人間が理解可能なルールを見つけるのには十分である場合が多いです。分析時間や維持コスト、そのデータを分析するためのプラットフォームのコストも低くなります。さらに、このようなスモールデータは企業内に多く存在しており、B2Bのマーケティングなど日々の施策で発生したデータもMAやSFAの仕組みから簡単にダウンロードし、手元のデータとして活用した、データドリブン型のマーケティングが今後の主流になっていくと考えられています。

さらにスモールデータはシンプルであり、日々の業務から発生しているデータで業務担当者はよく理解しており、データサイエンティストでなくても十分に活用ができるデータです。スモールデータは、分析や業務に関連する関係者や意思決定が必要なマネージャーレベルでも理解が容易になります。

ビッグデータの解析について、時にはデータサイエンティストのような専門家の解釈が必要ですが、その理解を経営層へ説明することに苦戦しています。スモールデータはたいていの業務担当者が特別な専門知識が無くても理解が可能です。スモールデータの十分な活用は、業務関係者がそのデータから共通したナレッジを獲得し、データから戦略・戦術に変換をしていく方法を理解することを支援し、企業のマーケティング施策の立案を支援します。

スモールデータの活用と拡張分析(Augmented Analytics)

一般的なスモールデータを取り扱うユーザーにも機械学習やBIのテクノロジーが凝縮された拡張分析(Augmented Analytics)が有効になります。

今までのビッグデータはテレコムのCDRや、流通業の大規模なPOSデータのようにレコードの件数が多いという事で注目されていました。しかし現在では、様々な種類のデジタルデータが連携し、顧客の全体像を表す小さなデータの集合体という事もできます。デジタルデータ、購買履歴などは数億件単位ですが、支店数、従業員数、施策数、商品数、企業の支出に関するレコードなどは数千、数万件程度であることが多くなります。このようにビッグデータとスモールデータの活用は、目的に応じてデータとツールを使い分けを行っていくことが重要となります。

前回のブログで説明した拡張分析でも、「拡張されたデータディスカバリー(Augmented Data Discovery)」と「拡張された機械学習とデータサイエンス(Augmented Machine Learning & Data Science)」という考え方に分かれます。

今回説明しているスモールデータは「拡張されたデータディスカバリー(Augmented Data Discovery)」を活用することで、意思決定や戦術・戦略立案に役に立つ理解可能なルールやパターンをデータから発見し、ビジュアルで表現をしていくことが可能です。

ExcelのピボットテーブルやモダンBIのビジュアル分析だけでは見つけきれない、データに潜む複雑なルールやパターンを機械学習で発見し、それを分かりやすく説明してくれます。しかもデータサイエンティストのような専門的な知識が無くてもGUIで分かりやすく発見することを支援してくれます。

このようなツールの存在が、社内のいたるところで発生している、グラフや集計表をベースとした調査や分析をより的確にし、会社全体の意思決定能力を上げていくこととなります。

デジタルトランスフォーメーションを求められている現在、会社全体でデータドリブンの意思決定を展開していくために、この拡張分析の概念が重要なキーとなります。

ブレインパッドはこのような拡張分析のソリューションとして、”BrainPad VizTact” をリリースさせました。今回紹介したスモールデータの分析を実現するための有効なソリューションとして活用が可能であり、企業のデータドリブンでの意思決定を強力に支援するツールとして、お役立ていただけると確信しています。