デーウェアハウスの入門書、100ページ程度の薄い本ですぐに読むことができた。データウェアハウス専門の解説書と言うものは非常に少ないと思う。E・F・コッドの著書が有名で、僕自身も過去に読んだことがあるが、書かれている事象を個別に理解することはできても、読み終わった後に「結局、データウェアハウスとは何だろうか」と振り返ってみると、混乱してしまう面があると思う。データウェアハウスを知るのであれば、まずこの本のような入門書を手に取るのが良いと思う。
 データウェアハウスの基本をまとめると「データウェアハウスとは、企業が持つ膨大なデータを分析する為に構築する。基幹系データベースと異なり、情報を更新するのではなく追加していく特徴がある。データベース設計ではデータ更新を意識する必要は無いので、正規化ではなく、検索性能を意識して非正規化を考慮する。」と言うことになると思う。この本ではこのような基礎以外に、システム構成(セントラルデータウェアハウス、データマート)、設計(データクレンジング、メタデータ管理)、多次元データベース(スライシングとダイシング、ドリルダウンとドリルアップ、ドリルスルー)、データモデル(スタースキーマ、スノーフレークスキーマ)、データ活用(問い合わせ、多次元分析、データマイニング)、開発方法論などが取り上げられている。
 僕は、これらのテーマの中で特にデータマイニングに関心を持った。データマイニング手法として、アソシエーションルール・クラスタリング・クラス分類・予測・統計解析・ニューラルネットワーク・決定木が取り上げられている。この本では、各手法が何かという事に少し触れられているだけだが、データマイニングを学ぶためのきっかけにはできると思う。