DXを推進させるデータ活用は「カルチャーの変革」がカギ!
- DX
- データ活用
- データドリブン
- ../../../article/2023/07/domo.html
データウェアハウス(DWH)とはData Warehouseの略で、日本語では「データの倉庫」を意味する。企業内の様々なシステムに散在するデータを集約・整理し、分析しやすい形で保管しておくもの。過去から現在までの多種多様かつ大量のデータを集約し、ビジネス上の意思決定を支援することができる。
データウェアハウス(DWH:Data Warehouse)とは、基幹システムや販売管理システム、顧客管理システムなど、社内の様々な場所に蓄積されたデータを一元的に格納しておく「データの倉庫」です。
企業では様々な部門やシステムでデータが活用されていますが、それぞれが異なるデータ体系・形式が保管されており、このままではデータ分析を行うことはできません。データウェアハウスは、このようなデータを目的別、時系列など整理した形で保存することができ、データ分析や意思決定を支援するために設計されています。
近年、DX(デジタルトランスフォーメーション)の推進に伴い、データに基づいた意思決定(データドリブン経営)の重要性が高まっています。データウェアハウスは、社内の様々なデータを分析しやすいように一元的に管理・提供することが可能なため、DXやデータドリブン経営を支える不可欠なIT基盤として、多くの企業で導入されています。
データウェアハウスを十分に理解するには、混同されやすい関連用語との違いを整理しておくことが重要です。ここでは、「データレイク」「データマート」「BIツール」との違いを解説します。
データレイクは、さまざまな形式のデータを加工しない「生」の状態のまま貯蔵できる基盤です。
将来的な活用用途が決まっていなくても、まずはデータを貯めておく場所として機能します。これに対して、データウェアハウスは構造化データのみを、分析目的で整理・統合して格納する点で異なります。
データマートは、データウェアハウスの中から特定の部門や目的に必要なデータだけを抽出して構築されたものです。全社的なデータを保管するデータウェアハウスを「百貨店」とすると、データマートは特定のジャンルに特化した「専門店」に例えられます。
目的が明確なため、構築が容易で、データ量も少なく分析のレスポンスが速いのが特徴です。ルーチン業務には適していますが、分析範囲が限られるため、柔軟な分析には不向きです。
BIツールは、データウェアハウスなどに蓄積されたデータを可視化し、分析するためのアプリケーションです。データウェアハウスが「データの倉庫」であるのに対し、BIツールは倉庫からデータを取り出して、グラフやダッシュボードといった分かりやすい形に加工する「分析・可視化ツール」としての役割を担います。両者は連携して使われることが一般的です。
しかし、近年では、DOMOやPower BIといった、データウェアハウスとBIツールが一体となったものも登場しています。
| 用語 | 主な目的 |
|---|---|
| データウェアハウス | すぐに分析に使える形でこれまでのデータを保管 |
| データレイク | 多様なデータの保管 |
| データマート | 特定目的部門での分析 |
| BIツール | データの可視化・分析 |
データウェアハウスは、企業における様々な業務やサービスで活用されています。例えば、Eコマースでは、顧客の閲覧・購買履歴や属性データをDWHで整理・保管し、BIツールなどで分析することで、パーソナライズされた商品レコメンデーションを実現し、カート放棄率の低下や顧客ロイヤリティの向上に貢献します。
また、サプライチェーンという観点では、受発注・販売データに加え、市場トレンドや気象データなどの膨大なデータをデータウェアハウスに集約。BIツールやAIなどと連携して分析することで、高精度な需要予測を可能となり、在庫コストの削減や欠品による機会損失の防止、サプライチェーン全体の効率化に繋げることができます。
データウェアハウスの導入を成功させるためには、事前の計画と慎重な製品選定が不可欠です。ここでは、データウェアハウスの選定・導入する際の5つのポイントについてご紹介します。
まず、「データウェアハウスを使って何を解決したいのか」「どのような分析を行いたいのか」というビジネス上の目的を明確にすることが最も重要です。目的が曖昧なままでは、機能選定や運用設計が上手く定まらず、期待する効果を得られません。売上分析の精度向上、顧客行動の予測、経営指標のリアルタイム把握など、ビジネスゴールを明確にすることで、最適な製品選定とスムーズな導入につながります。
データウェアハウスの提供形態には、オンプレミス型とクラウド型があります。近年は、初期コストを抑えられ、柔軟な拡張が可能なクラウド型が主流となっています。一方で、オンプレミス型は自社の要件に合わせて細かくカスタマイズしやすく、基幹システムなど他のシステムとの連携もしやすいです。
| クラウド型 | オンプレミス型 | |
|---|---|---|
| 初期コスト | 低い(ハードウェア購入不要) | 高い(サーバー等の購入が必要) |
| 導入スピード | 速い | 時間がかかる |
| 拡張性 | 非常に高い(柔軟に変更可能) | 限定的 |
| 運用・保守 | サービス提供事業者に任せられる | 自社で専門人材が必要 |
| カスタマイズ性 | 制約あり | 非常に高い |
データウェアハウスは大量のデータを扱うため、分析クエリへの高速な応答速度と、上雷的なデータ増加に対応できる拡張性が求められます。扱うデータ量や同時アクセス数を想定し、十分な性能を持つ製品を選ぶ必要があります。
DWHは単体で機能するのではなく、データソースとなる業務システムや、分析に使うBIツールなど、様々な外部システムとの連携が前提となります。ETLツールや各種アプリケーションとの接続が容易か、連携用のコネクタが豊富に用意されているかを確認することが重要です。