12/18(土)にZABBIX-JPの勉強会に行って来たので、
簡単に所感などを書き留めておこうと思います。


「第3回 ZABBIX-JP勉強会 & 忘年会」
 http://atnd.org/events/10287


# ちなみにZABBIXとは、サーバやネットワーク機器に
# どれくらい負荷がかかっているかを監視したり統計取ったりするソフトです。
# それらの情報を元にシステムの不具合対処を行ったり、
# サーバ増強の計画を立てるのに役立てることが出来ます。


Zabbixの知名度が高いか低いかは、正直微妙かと思いますが、
勉強会は70名ほど、忘年会の方は15名ほど参加で、
僕が思っていたよりは多人数で、
アプリケーションのエンジニアやインフラ系のエンジニアが参加されており、
なかなか興味深い話を交換できたと思います。
# SIerの方はお会いしなかったですね。。


全体の雑感は以上として、以下のセッション毎に所感を記載します。
 1. 400台のサーバを監視する!Zabbixを用いた運用の実際
 2. Zabbixのアクティブチェックの拡張開発
 3. Zabbix 2.0のロードマップ


■1. 400台のサーバを監視する!Zabbixを用いた運用の実際
発表者: 諸富 洋(もろとみ ひろし)/ ミツバチワークス株式会社 (@DECOLOG_TECH)
資料:http://www.zabbix.jp/files/seminar/20101218_zabbix_studymeeting_mitsubachiworks.pdf


今回の勉強会は、このセッションを聞くために参加しました。
監視や統計情報などがばらばらになっていて訳が分からなくなっている状態を
何かフレームワーク的なもので、整理できないだろうか?
という問いの回答の一つとして、僕はZabbixに関心を持ったのがそもそもです。
そして、いざ導入すると考えると導入している人の話を聞くのが一番良いと思ったわけです。


DECOLOGというサービスをLAMPで構成されたサーバ群400台で運用されており
それをZabbixで監視されているとのことでした。
Zabbix導入について
「ちょっといじったけど、Zabbixはすんなり導入できた」という感じでした。


Zabbixの実際の運用の話は、以下のような点が印象的でした。


アラートメールについて:
・アラートメールを出す閾値はPDCAで決めていった(最初は甘めで)
・障害にならないように予兆の段階でアラートすることも考える
・アラートは以下の3レベルに分けて通知する(すべき対応ベースで分類)
  alert: 数が多くないかを見る
  high: 警戒し、Zabbixを見る
  critical: すぐに対応する


統計について:
・グラフを見て急激な変化をしていないか、1台だけずれた変化をしていないかをみる
・統計とるのは欲張りすぎない、Zaabbixが遅くなるから
・仕事しながらチラ見できるようなZabbixのスクリーンを作っておく


自社サービスを運用するエンジニアという同じ立場だったので、
とても参考になり、「あー、わかる」と共感できる場面も多く、興味深く拝聴しました。


雑談的な話で、
(DECOLOGの顧客が若い女性(F1層)なので、)
嵐やエグザイルがTVに出演しているとトラフィックが落ちる傾向があるとか、
仲間募集(要するに求人)を訴えていた辺りも、面白かったですね。


早速、DECOLOGさんのブログにも、勉強会の話がエントリされているようです。
http://tech.dclog.jp/2010/12/zabbixdecolog.html


■2. Zabbixのアクティブチェックの拡張開発
発表者: 鈴木崇文(すずき たかのり)/ ZABBIX-JP (@BlueSkyDetector)
資料1:http://www.slideshare.net/BlueSkyDetector/zabbix-meeting-20101218021-takanori-suzuki
資料2:http://www.slideshare.net/BlueSkyDetector/zabbix-meeting-20101218022-takanori-suzuki


Zabbix-serverをAct/Act構成で運用できるようにするための機能拡張の話、
一言で言ってしまうと「拡張してみたので使ってみて下さいね」という話です。


Zabbix-Agentに対して複数のZabbix-serverを設定できるようにしたので、
Zabbix-serverをAct/Act構成いけます。
なのですが、実際にAct/Act構成にするとなると、
同一設定のZabbix-serverを構築・同期するのが大変とか言う問題もあるので、
まだまだいろいろ考えなきゃですねって話でした。


機能拡張って、影響範囲が大きくて難しいものです。


■3. Zabbix 2.0のロードマップ
発表者: 寺島広大(てらしま こうだい)/ ZABBIX-JP (@kodai74)
資料:http://www.zabbix.jp/files/seminar/20100911_OSC2010TokyoFall_Alexei.pdf


今後、Zabbixがどのような機能拡張を行っていく予定なのかという話。


・監視対象を自動的に追加していく機能の拡張
・スクリーンを使いやすく
・監視側・サービス側2つのIPアドレス持っているホストをまとめて管理できる
・ZapCatというJavaのリソース管理のパッケージを標準に取り込む
などなど。。


この辺りは機能が取り込まれてから安定するまではしばらくかかるので、
ふむふむなるほど、頭の片隅においておこうという感じでした。
Zabbix使ってみて、あった方がいいって思った機能は声上げた方がいいかもですね。


以上、「第3回 ZABBIX-JP勉強会 & 忘年会」の所感でした。
思ったより長文になってしまいましたが。