catch-img

“Small Data“の価値とそれを活かせる”拡張分析“


目次[非表示]

  1. 1.Small Dataってなに?
  2. 2.Small Dataの価値
  3. 3.Small Dataの価値を活す
  4. 4.拡張分析


Small Dataってなに?

最近自分の仕事関係でよく聞くようになった”Small Data”というキーワードがありますが、”Big Data”と比較すると全く馴染みがないと思いましたが、検索してみると意外とBig Dataが流行する前からすでに使われている言葉でした。
また、2014年がSmall Dataの元年と言われているが、遥か前から日本の大学などですでに”Small Data”という言葉が使われていたようです。

気になりましたので、日本とアメリカと中国の”Small Data”と”Big Data”のトレンドを比べてみました。
Big Dataはどの国も減少しているに比べて、Small Dataは日本ではまだまだ注目されていないが、アメリカでは緩やかに上がっている傾向ではあります。

■日本のSmall DataとBig Dataのトレンド:



■アメリカのSmall DataとBig Dataのトレンド:



■中国のSmall DataとBig Dataのトレンド:

※2010年以後中国本土はGoogleより百度の検索エンジンを利用することが多いので、中国全域の結果ではないと考えられる。


実際3ヶ国語でそれぞれ検索してみると関連記事やブログの数もかなり違うように思いました。
多くの”Small Data”の記述の中で一番好きなのは下記の定義です。

Small Data(Big Dataおよび/あるいは「局所的な」情報源から導出された)タイムリーかつ有意義な洞察を、アクセス可能かつ理解可能、日々の業務でアクション可能なかたちに(そしてしばしばビジュアルなかたちに)体系化してまとめ上げたうえで、人と結びつけるものである。
Paul Greenberg (Special to ZDNet.com) 翻訳校正: 村上雅章 野崎裕子 2013-12-13 07:30



Small Dataの価値

スタンフォード大学は、2017年秋に「Small Data」というタイトルのコースを開催していました。また、Martin Lindstromは企業がビッグデータだけに頼るのではなく、Small Dataを通して優れた製品とサービスを創る方法についての本まで書いています。Lindstromは本の中で、“If one takes the top 100 biggest innovations of our time, perhaps around 60% to 65% percent are really based on Small Data” 訳:"今の時代のトップ100のイノベーションを選び出す場合、おそらくそのうちの約60%~65%実はSmall Dataに基づいている"と宣布しています。
上記の例のように、Small Dataの価値はすでに世界で注目されるようになってきました。


また、誰でもデータ分析ができて、しないといけない今の時代ではBig DataとくらべたらSmall Dataの分析にかかった費用と効率の差が著しいです。

実際、データセットの規模とそれが生成できる洞察との間にはほとんど相関関係がなく、データが大きくなくても、データが役に立たないわけではありません。
データから価値を引き出すということになると、データの大きさなどよりもデータを深く理解することが大事だと思います。

いまでは多くのデータを使用した分析に注目していて、BigDataから個人の価値を見落としていると思います。
例えば、パーソナライズの世界でBig Dataから発見の掟を適用するのは本当に顧客一人一人のためなのかとても疑問に思います。


Small Dataの価値を活す

Small Dataをもっと活かせるために、まずは、Small Dataの限界を知っておいた上の利用が必要です。
Small Dataは偶然のバラツキがあり、データ偏りがちです。しかし、それは有用でないという意味ではありません。
手元のデータでできることとできないことをきちんと知ることは、そのデータから正しい答えを得るための鍵だと思います。
Small Dataをに利用する際は特にデータの内容と背景を理解することがとても大事になります。

データの内容と背景を理解した上で、データセットが十分に小さい場合、あるポイントに集中して視覚化することだけでも傾向を知ることができます。
単純にデータをプロットすることでも、実は多くの場合、パターンをみつけることができます。

例えば、下記は”何か人々の幸福度を影響している”を調査するためのデータをBrainPad VizTactでプロットした結果です。

簡単な可視化で「”自由”と”健康”が”人々の幸福度”に影響している」というような価値のある結果を得ることができます。

このような誰でもわかる表現で瞬時に示唆を得ることこそが、データ分析本当に目指したいところではないかと私は思います。

ただ、実は単にビジュアル化をすることでは、何か一番ターゲット(このデータの”人々の幸福度”を指す)に影響しているのかを判断することがとても難しいです。
そこで、更にSmall Dataを活かす方法の一つ”拡張分析(Augmented Analytics)”という分野を簡単にご紹介したいと思います。


拡張分析

Gartnerは2017年の新興テクノロジーのHype Cycleレポートで”拡張分析(Augmented Analytics)”という用語を作り出し、それが「データ分析の未来」であると主張しました。

下記はすべての国で”拡張分析(Augmented Analytics)”キーワードのトレンドとなります。この一年でかなり人気向上していることが読み取れます。


拡張分析はとは、機械学習やAI(人工知能)を組み込んだデータ分析のことを指す。 
従来のデータ分析との違いは、AIにデータの構造を学習させることで、人々にインサイト(洞察)を提供するところまでを“自動化”できることです。

データが生データソースから自動的に取得され、分析され、公平な方法で、人間が理解できる自然言語処理を使用したレポートで伝えられます。

ExcelやBIツールで分析する場合、担当している人が思いつく限りの結果しかでません。
多くのパターンを見るための労力とセンスが重要です。
それに、多くの結果だしても最終的にどれか一番ターゲットに影響しているのがわからないままで終わってしまいます。

また、データサイエンティストの皆様が分析した結果を上司や顧客にわかるように、プレゼン資料を作ったり、結果を視覚化したりしていると思います。
簡単な分類や回帰なら、一つのツールで分析を完結することもできます。
例えば、先程プロットした人々の幸福度に影響している要因を調査するためのデータを分析したい場合、BrainPad VizTactの機械学習を組み込んだメニューでは下記のような結果がすぐに出すことができます。

■ 要因分析機能で要因の一覧:


■要因説明機能で結果を自然言語とグラフで表現:

結果をわかりやすく言葉とグラフで表現しているので、データアップロードしてすぐに上記のような画面表示ができて、BIツールで軸を考えてから出すよりはかなり効率的ではないかと思います。


最後に、まとめとしまして、

データセットが小さいからといって、価値がないわけではありません。
​​​​​​​Big Dataの時代には、小さなデータの力を無視することがよくありますが、効果的に使用すれば、Small Dataでもビジネスに大きな価値をもたらすことができます。
また、正しい考え方と手法でアプローチすれば、問題を異なる角度で見るのに大いに役に立つ可能性もあります。


Small Dataの活用にぜひ拡張分析ツールで試してみてください!きっと新しい感動が生まれると思います!


人気記事ランキング