中小企業データ予測の限界
世界的な大手企業だけではなく、中小企業もAIが普及した今、ビッグデータ分析を活用した予測はもうそんな珍しいことではないです。しかし、果たしてAIを活用すれば予測は当たるのかは疑問に持っている方も少なくないと思います。今回はその疑わしい予測の限界について少しお話します。
まずはデータ予測はどういう過程で、どんなデータ使うのか、予測の精度上げるにはどんなこと必要なのかポイントだけ理解が必要があります。
通常データ予測の過程
売上を予測したい場合、過去の一定期間のデータの傾向を基づいて行うものとなります、売上に影響にするかもしれないあらゆる関連性高いデータを集めて、一定な確率で売上を説明できるルールを発見します。そのルールの変化よって、売上も変化していきます。そのルールの変化が正確に捉えると売上もある程度予測が可能になります。
通常データ予測に使うデータ
具体的例でいうと、来年のあるビールの売上を予測したいとなると、まずは下記のような売上を説明できるかもしれない、影響するかもしれない大量な情報集めます。
・昨年日別同ビールの売上
・昨年日別同ビールの販売数
・昨年日別の気象情報
・昨年のテレビCM放送回数
・昨年のビール全体の売り行き
・昨年の顧客の評価
・昨年の顧客種類の比率構成
・昨年のイメージキャラクター
・昨年の売上計画
・昨年の在庫状況
当然上記に限らず、ビールの売上に影響しそうあらゆる関連性の高いものを集め、蓄積していく必要があります。
予測ための分析を簡単にいうと、その可能性の高いデータから一つでも多くよいルールを見つけて、予測を行います。
また、売上をうまく説明できるようなルールを多く見つけられるほど、売上を正確に予測できます。
データ予測の精度を上げるには
予測に貢献の高い良いルールを見つけるために、可能性の高いデータを期間長く、種類多く集める必要があります、
そうすると、データの量がどんどん増えていきます。
そのデータ分析するために加工が徐々に複雑になり、大量のデータの処理にハードウェアの性能もどんどん高めていかないといけなくなります。
さらに、複雑になっていくデータを分析するために相応なデータ分析の知識がある人材も必要となり、所要時間が増えていきます。
精度を1%上げるためにアナリストやデータサイエンティストたちは各種のアルゴリズムを駆使したり、データを集めるところから考えると何日何ヶ月努力していくような世界です。
予測の限界の一つは不安定な外部要因
データ集めたり、ハードウェアを強化したり、データ分析の人が苦労したり、折角上げた1%の精度が結果ですが、現実の世界では有名タレントがSNS上の1枚の写真の影響の方が高いかもしれません、、、
また、地震などの自然災害、コロナのような病難、過去にデータが存在しない突如なことの影響は想像もつかないものです。
スピーディーで安価で分析が必要
大企業のように数千万でシステムの統合、データベースの構築、データ予測分析ソフト、データ分析要員の確保もしくは教育には相当難しいことが読み取れます。それにデータ分析が得た効果はコロナのような一撃には耐えられないこともわかります。
だからといって、分析する必要性が無いではない。
必要なのは少ない投資で、データの変化にすぐに対応できるような自由度の高い分析、高度分析人材の確保や育成よりも短時間で効果を出すことではないかと思います。
また、ITへ投資で解決したい経営課題についての調査結果ではプロセスの効率化、2番は迅速な情報把握ができることから時代は自社分析システム構築する、時間かけて外部委託するよりも効率よく、タイムリーに結果出すことを要求していることがわかります。
<出所>日本情報システム・ユーザー協会
ビッグデータ分析のデータベース構築で数千万円、機械学習ツールの数千万円の投資の代わりに、VizTactのような初期投資ない、既存の”スモールデータ”から示唆が得られる拡張分析の需要は間違えなく今後が必要となります。
拡張分析ができることに関してはぜひ下記他のブログをご参照ください。