「センサーによるデータ計測と異常検知の基本」IoTLT発表で参考にした書籍の紹介
この記事は、IoTLT Advent Calendar 2018 の15日目の記事です。
IoTLT Advent Calendar 2018
https://qiita.com/advent-calendar/2018/iotlt_neo
今年(2018年)の10/15に開催されたIoTLTでLTした、
「センサーによるデータ計測と異常検知の基本」
の準備をする中で参考にした書籍について、この記事で紹介しておこうと思います。
センサーによるデータ計測と異常検知の基本
LT発表資料
SlideShareにLT資料をアップしています。
参考文献の紹介
LT発表の末尾のスライドにも記載していますが、
参考にした書籍について紹介していきます。
天野直紀「実践IoT 小規模システムの実装からはじめるIoT入門」オーム社 2018
IoTを実際にはじめてみるための知識が幅広く紹介されている書籍です。データ分析、クラウド、通信技術、センサー、電源等の技術要素について紹介されています。IoTの本としては比較的多くのページが、データ分析に割かれているイメージです。
私の主観的なイメージで申し訳ないですが、IoTLTというイベントは、デバイス、通信、Webでの可視化あたりの話が多いので。IoTLTに参加されている方で、データ分析という視点からのIoTを知りたいという人には、適した書籍では無いかと思います。但しデータ分析については、AzureML、R言語、ディープラーニング、センサー、波や振動などのテーマが盛りだくさんなので、独学かつこの本だけで理解するのは難しいとも感じました。あくまでも、IoTとデータ分析が絡んだときにどんな事が出来るのか、どんな知識を学ぶ必要があるのかという知識獲得は出来ると思います。
また、センサーについてはよく整理されていて、私の発表スライドの6ページ目はこの書籍の情報をベースにしています。
井出剛、杉山将「異常検知と変化検知」講談社 2015
次に紹介する「入門機械学習による異常検知」の続編という位置づけの書籍です。異常検知・変化検知の基礎と、それらに適用できるアルゴリズムとして、近傍法、混合分布モデル、サポートベクトル、ガウス過程回帰、部分空間法、グラフィカルラッソ、密度比推定などが説明されています。講談社の機械学習プロフェッショナルシリーズの書籍の1つです。
説明も丁寧でわかりやすく、難易度的にも大学学部レベルの数学の教科書が読める人であれば、普通に読めると思います。ただし、アルゴリズムの説明は図や数式で示されている(サンプルプログラムは一切ありません)ので、PythonやRなどを使ってシステムに組み込む場合は、自分でライブラリを見つけてくる、見つけられない場合は、数式を理解してプログラムに落とすだけの技術力は必要になります。
異常検知に関する知識が無い人は「入門機械学習による異常検知」を先に読んだ方が良いと思います。
井出剛「入門機械学習による異常検知」コロナ社 2015
先に紹介した「異常検知と変化検知」の基礎編となる位置づけの書籍です。異常検知の考え方と評価、いろいろなパターンのデータに対するアプローチとして、正規分布に従うデータ(マハラノビス・タグチ法など)、非正規データ(k近傍法など)、入出力のあるデータ(線形回帰など)、時系列データ(自己回帰など)のアルゴリズムが説明されています。
副題が「Rによる実践ガイド」となっており、各アルゴリズムの説明、R言語のサンプルプログラムという流れになっています。Rでのサンプルを動かしながら、アルゴリズムの説明を読むという手段をとることも出来るので、読みやすいと思います。また、システム化する時もサンプルコードが参考に出来るでしょう。全てのアルゴリズムにサンプルプログラムがある訳では無いですが、サンプルプログラムが無いと難しいという人は、サンプルがあるアルゴリズムだけを学習するために購入するのもアリだと思います。
この本だけ読めば、基本的な異常検知のアルゴリズムの知識は得られる本なので、異常検知に関心があるのであれば買って損は無いです。説明も丁寧でわかりやすいですが、内容は盛りだくさんなので、難しいと感じたらゆっくり何度も読めば良いかなと思います。
山西健司「データマイニングによる異常検知」共立出版 2009
この書籍では、異常検知の基本と、3種類の異常検知手法のアルゴリズムとして、外れ値検知のアルゴリズム「SmartSifter」、変化点検値のアルゴリズム「ChangeFinder」、異常行動検知「AccessTracer」の説明がされています。各アルゴリズムがどのような分野で応用できるかというところまで書かれているので、アルゴリズムの適用イメージまで知ることが出来ます。先に紹介した2冊が教科書っぽく体系的にまとまっているのに対して、この本は基本の説明+研究と適用のまとめという印象を受けました。
紹介されているアルゴリズム(SmartSifter、ChangeFinder、AccessTracer)に関するわかりやすい解説が欲しいのであれば入手すべきだと思いますが、先に紹介した2冊の書籍よりは少し古い本になるので、手に入りにくいかも知れないです。異常検知の基本という部分に期待するのであれば「入門機械学習による異常検知」の方が入手しやすいので、そちらの書籍で良いかなと思います。
以上、
「センサーによるデータ計測と異常検知の基本」発表での参考書籍を紹介させて頂きました。
IoTLTの5分程度の発表ではアルゴリズムまで説明する事は難しいので、
興味を持った方は、紹介した書籍を手にとって頂ければと思います。
また、来年以降も
IoTLTでデータ分析を絡めたLTをしていければと思っています。