データ分析に使えないデータ設定、システム???

データ分析をしようとしても、データが使えないという情報システムを使っている企業は多い。
昔、ベテランのシステムエンジニアに基本的に、どの業態も商品を仕入れて、在庫し、販売するだけであるし、もとになる情報も売価、原価、数量だから、まったく同じ標準的なシステムさえあれば、すべての業態、すべての企業が同じシステムを使うことができるのでは?と疑問を投げかけたことがある。
その時の彼の答えは、そんなことをしたら各企業からのカスタマイズがなくなるから、この業界の規模、システムエンジニアなどの人材を維持することができなくなるというものだった。
業界を支えるためのカスタマイズという彼の説明がどこまで本当かは分からないが、長年小売とかかわっていると必要と思われるデータはある程度限られていることが分かる。
したがって、情報システムもあれこれ変えずに基本的なものをスタンダードとして設定すれば、最低限必要なことはできるし、その方が安くてメンテナンスも楽なはずだが、なぜかどの企業もカスタマイズしたがる。
ところが、現状を見ると、使えない情報システムを使っている企業が実に多い。必要なデータ、欲しいデータが取れないというのはもちろんだが、それ以前にそもそも何が必要なデータなのかが分かっていないといった感じである。

基本的に数値は項目、単位、期間という3項目からなる。
項目は、売上、在庫、仕入の数量、金額が基本である。それに売価、原価、売価変更(値上・値下)・値入・粗利などの金額と率。客数(精算件数)・客単価・買上単価・買上点数、商品回転率や交叉比率、粗利率相乗積など、数値はいろいろあるがそれらは、売上、在庫、仕入、客数(精算件数)、買上点数など基本的な数値から算出することができるから、基となる数値は限られている。
知りたい情報も時系列変化、部門・ライン・クラスなど単位の系列で分解、統合して内訳や構成を見ることが中心だから、そんなに複雑で難しい処理も必要はない。
むしろ重要なのは商品構成であるが、残念なことにPOSのコード設計が元々事務処理であるため、単品の識別にしか使えない。
商品名、商品コード、JANコード、どれをとっても類似する商品を識別することは難しいから、商品が持つ特性のうち、どの特性が支持されて商品がよく売れているのか分からない。
例えば、チョコレートをタイプ別や成分別に売上(金額・数量・構成比)/在庫/仕入/値入/粗利/商品回転率などを見ようと思っても商品マスターを一つ一つチェックして集計しないと分からないから、そんなことに手間をかけて分析をすることはほとんど不可能といってもよい。
ビッグデータの時代でも、単品の識別は可能でも集計するためのフラッグがなければ肝心な集計ができない。ABC分析はできても様々な切り口での集計ができないデータでは、1つ1つ見るか、数百アイテムをまとめて合計として見ることしかできない。
例えば、週別に時系列でサイズ比率、色比率が変化することは分かるかもしれないが、色×サイズ別比率がどう変わるかはわからない、素材×デザイン、素材×デザイン×色×サイズなど、商品によって知りたい内容は異なるが、商品構成における最も重要な要素間の比率が分からない。

情報時代、データが重要と言いながら技術ばかり進歩しても肝心のデータ分析とは何か、データ分析のためにデータをどのように持てばよいかという最も基本的なことの理解がなければ、技術もシステムも生かせない。
そのことすら気づいていないとなると手のつけようがない。
本当の意味でデジタル化時代と言えるようになるには、実態を本質的に見直して変えていかなければならない。
データ分析からプログラミングまで一人でこなせるデータサイエンティストが必要とされるのも分かるような気がする。専門的なスーパーマンを養成するしかないが、まずは体制を整えることから始めるしかないのだろう。
対応が急がれる。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください