DWHシステムとは膨大なデータを保管する役割を持つものです。
ビッグデータの活用において欠かせないものですが、データ分析を行うBI、DBとも間違えられやすく、
イマイチ理解していない方も多いのではないでしょうか?
そこでこの記事ではDWHに関する以下のことを紹介します。
- DWHの基本概要
- DWHと他ツールの違い
- ツールの選定ポイント
- DWHツール紹介
DWHはビックデータを扱う上で必要不可欠なものであるため、データを扱う方は必見の内容です。
DWH(データウェアハウス)とは?
先程も述べたDWH(データウェアハウス)とは、膨大なデータを扱うのに特化したもので、
データの倉庫のようなものとイメージしていただければ分かりやすいでしょう。
データの移り変わりがわかるように履歴が残っており、データは上書きされずに古いデータから新しいデータまで全て記録されます。
DWHの定義は4つ
DWHの定義は4つあり、以下のものが挙げられます。
- サブジェクト指向
- 統合
- データを保存する
- 時系列でデータを蓄積
それぞれを詳しく見てみましょう。
サブジェクト指向
基幹システムのデータベースでは、業務に応じて最適化された形でデータが整理・処理されます。
しかしDWHではサブジェクトに基づいてデータが整理・蓄積されます。
各々のシステムにある元データを解体し、統一的なテーマを軸に情報を再編可能です。
DWHは複数のサブジェクトを軸として構成されているデータベースとなっています。
統合
統合とはデータの分類・命名・表記や単位などを全て揃えることです。
複数のシステムから同じ名前のデータを集めても、各々のシステムでデータの定義が異なれば、
本来分けるべきデータも組み合わせてしまう可能性があるため、データをうまく収集できません。
しかし、別々の名前のデータであってもDWHのデブジェクトによっては同じとみなされてしまう可能性もあります。
データを保存する
DWHはデータの倉庫と言われていることもあり、その名の通りデータを保管する場所です。
保管されているのは処理済みのデータとなっており、古いデータ・新しいデータに関わらず、全てを一緒の場所に蓄積します。
長期間に渡って保存されたデータは有効な経営分析・意思決定を行う際に必要となる情報です。
DWHは時系列でデータが整理されているため、過去の状況を簡単に把握できます。
時系列でデータを蓄積
DWHはトランザクションの日時に合わせてデータを蓄積でき、更に時系列上に位置づけられます。
ビジネスにおいて必要なのは過去のデータです。
しかしデータの時間的な推移がしっかりと記録されていないがために、分析がしっかりとできないこともあります。
そんなとき、DWHの時系列データならば、一つ一つのデータ項目がどのように変化したのか推移をしっかりと確認できます。
場合によっては長期間経過したデータを消去することもあるものの、長期間のデータ保管に優れているものです。
DWHと他ツールの違い
DWHと勘違いされる言葉として以下のものがあります。
- ETL
- BI
- DB
実際にそれぞれとの違いを見ていきましょう。
ETLとの比較
ETLとはDWHの一部の機能で、データ収集に関わる重要な役割を担っています。
DWHはデータを収集する際、各ソースからサジェストに応じてデータを
抽出、管理・分析に適した形に変換し、ロードする必要があります。
これらを行うのに必要なのがETLです。
ETLがなければDWHはデータを収集できないのです。
BIとの比較
BI(ビジネスインテリジェンス)の略称であり、
企業内の各種データからどのように意思決定をするのかサポートしてくれるものです。
ビジネスにおいて必要な情報収集・保存・分析をする際にも役立っています。
BIツールはDWHで収集した情報を分析・可視化できます。
DBとの比較
DWHのDBは先ほど紹介した4つの要件を満たす特別なタイプのものです。
ビジネスの場で使用されるデータベースは基幹システムのデータベースが一般的であり、
これは1つの部門に特化しているものです。
1つの部門に特化しているため、素早く効率的に処理ができます。
それに対しDWHは真反対の性質となっています。
DWHツールの選定ポイント
DWHツールの選定ポイントは以下の4つです。
- 操作性
- データの処理速度
- 容量の拡張性
- 多数のツールとのデータ連携
それぞれを詳しく見てみましょう。
操作性
基幹システムのデータベースでは、業務に応じて最適化された形でデータが整理・処理されます。
しかしDWHではサブジェクトに基づいてデータが整理・蓄積されます。
各々のシステムにある元データを解体し、統一的なテーマを軸に情報を再編可能です。
DWHは複数のサブジェクトを軸として構成されているデータベースとなっています。
データの処理速度
基幹システムのデータベースでは、業務に応じて最適化された形でデータが整理・処理されます。
しかしDWHではサブジェクトに基づいてデータが整理・蓄積されます。
各々のシステムにある元データを解体し、統一的なテーマを軸に情報を再編可能です。
DWHは複数のサブジェクトを軸として構成されているデータベースとなっています。
容量の拡張性
基幹システムのデータベースでは、業務に応じて最適化された形でデータが整理・処理されます。
しかしDWHではサブジェクトに基づいてデータが整理・蓄積されます。
各々のシステムにある元データを解体し、統一的なテーマを軸に情報を再編可能です。
DWHは複数のサブジェクトを軸として構成されているデータベースとなっています。
多数のツールとのデータ連携
基幹システムのデータベースでは、業務に応じて最適化された形でデータが整理・処理されます。
しかしDWHではサブジェクトに基づいてデータが整理・蓄積されます。
各々のシステムにある元データを解体し、統一的なテーマを軸に情報を再編可能です。
DWHは複数のサブジェクトを軸として構成されているデータベースとなっています。
DWHツール5選
ここでは、有名なDWHツールを5つ紹介します。具体的には以下のとおりです。
- trocco
- Azure Synapse Analytics
- Metaps Bridge
- SOFIT Super REALISM
- YDC SONAR
それぞれのツールを詳しく見ていきましょう。
trocco
公式サイト:trocco
データの転送・統合・ETLに特化しています。
DWH・DS製品・クラウドストレージと200以上のソースとの間で転送ができるため、幅広い場面で活用できます。
扱いやすいUIによりすぐに使い慣れるのも特徴です。
提供形態はクラウドとなっており、料金は要問合せです。
Azure Synapse Analytics
公式サイト:Azure Synapse Analytics
分析に特化している総合プラットフォームです。Microsoft AzureのAI機械学習サービスとの連携ができ、より使いやすくなっています。
プログラミング言語も多数の中から選択でき、コードなしでのETLプロセスの作成も可能で利便性の高いものです。
提供形態はクラウドとなっており、料金は要問合せです。
Metaps Bridge
公式サイト:Metaps Bridge
モバイルアプリによるマーケティング支援に特化しているツールです。
自社アプリや外部トラッキングに対応しており、それらのデータをもとにKPI分析やランキング集計とデータ分析ができます。
これがあれば、モバイルアプリのマーケティングはスムーズにできるでしょう。
提供形態はクラウドとなっており、料金は要問合せです。
SOFIT Super REALISM
公式サイト:SOFIT Super REALISM
日本ソフト開発株式会社が提供するDWHツールです。
世界最高レベルの処理速度によって、ストレスなくツールを使えます。
既存のシステムには左右されず、膨大なデータを一元管理できるため、利便性も非常に高いものです。
データ量が多く処理速度に困っている企業に最適でしょう。
提供形態はクラウドとなっており、料金は要問合せです。
YDC SONAR
公式サイト:YDC SONAR
データの転送・統合・ETLに特化しています。
DWH・DS製品・クラウドストレージと200以上のソースとの間で転送ができるため、幅広い場面で活用できます。
扱いやすいUIによりすぐに使い慣れるのも特徴です。
提供形態はオンプレミス・クラウドとなっており、料金は以下の通りです。
- スタンドアロン版:400万円
- 小規模版: 1,200万円
- 中規模版: 3,500万円
- 大規模版: 8,000万円
- 巨大規模版:要相談
- クラウド
月額 280,000円~
まとめ
この記事ではDWHを紹介しました。
DWHシステムがあれば、社内にある大量のデータを高速で処理できます。
しかし製品によって特徴は異なるため、自社が重視することを明確にしてから導入するのがおすすめです。
予算や機能、特徴を確認してから導入しましょう。