連載 [第3回] :
  Zabbix Summit 2023レポート

Zabbix Summit 2023に日本から参加したスピーカーにインタビュー

2023年12月21日(木)
松下 康之 - Yasuyuki Matsushita
Zabbix Summit 2023にスピーカーとして参加したトヨタ、NTTコム エンジニアリングのエンジニアにインタビューを行った。

モニタリングソリューションのZabbixがラトビアの首都リガで開催したZabbix Summit 2023に、スピーカーとして参加したトヨタとNTTコム エンジニアリングのスピーカーにインタビューを行った。それぞれのセッションの概要とともに、Zabbixを使った大規模なモニタリングシステムに関する考察なども含めて紹介する。

大規模インフラのモニタリングにZabbixを利用するトヨタ

2日間の初日に登壇したのはトヨタの阿部博氏、セッションのタイトルは「Monitoring Green Power and Distributed Edge Computing Infrastructure with Zabbix」で、車輛からのデータを複数のデータセンターで構成される大規模構成のインフラストラクチャーを使って分析する際の分散モニタリングをPoCとして検証したという内容だ。詳細は以下のスライドを参照されたい。

●阿部氏のスライド(PDF):Monitoring Green Power and Distributed Edge Computing Infrastructure with Zabbix

残念ながら阿部氏のセッションはスライドが最新の内容ではないものが投影されてしまったというトラブルの影響で、公開されていない。

多くの参加者が参考になったと語るNTTコム エンジニアリングの失敗談

NTTコム エンジニアリングの福島崇氏のセッションも複数のブランチオフィスから通知されるモニタリングにおける障害発生通知を、チケット管理システムと連携して自動化するユースケースにおける失敗談を紹介するもので、今回のカンファレンスでも多くの参加者が参考になったとコメントを寄せていたセッションとなる。タイトルは「Tips and Tricks on using useful features of Zabbix in large scale environments」だ。

●福島氏のスライド(PDF):Tips and Tricks on using useful features of Zabbix in large scale environments

●福島氏の動画:Tips and Tricks on using useful features of Zabbix in large scale environments

福島氏のセッションはiPadをカンニングペーパーとして使用し、時にユーモアを交えて行われた。

Zabbix本社のエントランスで撮影。阿部氏(左)と福島氏(右)

Zabbix本社のエントランスで撮影。阿部氏(左)と福島氏(右)

インタビュー

今回はラトビアのリガでセッションをされたわけですが、その背景を教えてください。

阿部:私の場合は2023年のInteropの際にZabbixのブースで今回のリサーチを紹介したことがきっかけですね。その経緯でZabbix Summitでセッションを持ったらどうか? というお話をいただきまた。

福島:Zabbixさんのイベントはずっとスポンサーとして支援してきたんですが、今回もその流れでスポンサーとして講演をさせてもらったということになります。私自身は2009年にNTTコムテクノロジーに入社して以来、何度か社名も変わっていますが、ずっとZabbixとの関わりを持って仕事をしています。今回は事例の紹介とともに経験したトラブルについても解説したという内容です。

今回の福島さんのセッションが際立っているのは海外で行う事例紹介なのに失敗談が多く含まれているということだと思いますが、それについては?

福島:私はよくこういうセッションでお話をする際に、プレゼンテーションを行う皆さんがマジメ過ぎると感じていたんですね。そこで私のセッションは、いつも笑えるポイントを入れておいて後から「あのセッションはおもしろかった」という記憶として振り返ってもらいたいという気持ちを持ってスライドを作成していますね。そういう記憶は後まで残りますから。

4年前のZabbix Summitでもセッションを担当しましたが、その時も笑えるポイントを入れたプレゼンテーションをやってかなりおもしろいと思ってもらえたという記憶があります。

今回はトヨタさんもNTTコム エンジニアリングさんもかなり大規模なシステムにおけるモニタリングというお話ですが、トヨタさんのセッションでは後半OpenTelemetryとの連携みたいな部分がZabbixに対する要望として挙がっていました。これは同じ日のキーノートでアレクセイさんが「対応を予定しています」って先に言っちゃったってことですよね?

阿部:そうですね。今のシステムではクラウドネイティブなシステムになるとOpenTelemetryの存在を無視することはできないかなということで、あの要望を入れました。別のルートで要望も出してあったんですが、あっけなくアレクセイにやりますって言われたので、ちゃんと叶えてくれたということになります。

今回は単にモニタリングを行うだけではなく電力の使い方に対してもグリーンエネルギーを使うという試みをやっていますが。

阿部:トヨタ全体としてグリーンエネルギーには積極的に取り組もうという流れの中で、R&D部門としてはProof of Conceptとしてエッジ側に処理を寄せる、太陽光発電として一番、発電量が多いところに処理を寄せることが可能かということで、東京と北海道のデータセンターでデータを同期させるという実験をやったんですね。その内容を発表しています。結果としてZabbix Proxyを使うことで、リアルタイム性が高く要求されないような使い方であれば充分に使えるというのが今回の検証結果ですね。

福島さんのセッションでは大規模システムにおけるモニター対象をどうやって自動的に監視システムに参加させるか? というようなポイントが解説されていました。これはFIDO Allianceが監視カメラなどを認証システムに組み込むためにFIDO Device Onboarding(FDO)というテクノロジーを開発してIoTデバイスなどについてマニュアルでシステムに追加して認証するのを自動化するための技術なんですが、同じようなニーズがあるんだなと感じました。監視カメラが工場で作られて出荷され、販売店を経由してユーザーに渡るまでの間でカメラのIDとメーカー側のシステムを紐付けるためにランデブーサーバーを用意してそこでカメラのIDが遷移していって最後にユーザーに行き着いた時にIDを認証するためのシステムなんですが、モニタリングでも監視対象をマニュアルで管理するのではなく自動化したいというニーズがあるということだと思います。その辺について教えてください。

福島:その辺のニーズがあるのもわかっていまして、今回はその辺りも内容として追加しようかと思っていましたが、時間の関係で省きました。システムがクラウドっぽくなっていった時にZabbixがクラウドも監視できますというのではなく「クラウド使うなら監視はZabbix」と言われるようにならないといけないとは思いますね。

今回、他の発表などで気になったものはありましたか?

Zabbix本社の会議室で。阿部氏(左)と福島氏(右)

Zabbix本社の会議室で。阿部氏(左)と福島氏(右)

阿部:OpenTelemetryはもう予定に入っていたので安心しましたけど、ZabbixからKafkaなどのストリーミングシステムにデータを流せる仕組みが計画として挙げられていたのは良かったですね。あと先ほどの福島さんの話にもありましたけど、ゼロタッチプロビジョニングというのは究極の姿として必要なのかなとは思います。ネットワークベンダーの製品だと何も設定しないでネットワークケーブルだけ繋いだらあとはクラウド側から設定ファイルが降りてきて自動で設定されるというのは、理想形としては良いんですが、実際にはゼロどころじゃなくて500タッチくらいは必要だという(笑)。そういうのも監視システムのアプローチとしては必要でしょうね。

最近は、機械学習を使って構成ファイルを作りますとか、モニタリングの数値を見てそろそろエラーが起きそうだとサジェストしてくれるAIなどが話題になりますが、今回そういうのはありましたか?

阿部:特にはなかったかな。異常検知について原因を特定する部分の紹介は以前からされてますね。最近は、かつては統計処理でなんとかっていう部分の統計処理のところが全部AIに置き換わっているという傾向はありますね。ただAIはオープンなデータをモデルとして使うというのが今の状態だと思いますが、オープンにできないログとかの情報をどうやってAIに処理させるのか? などについても注目はしています。

あとはPrometheus関連の話も思ったほどはなかったような感じですね。メトリクスなどの細かいデータをPrometheusで、最後にZabbixに集約するみたいな話があると良かったかもしれません。今回はどの発表も実際に運用しているシステムでの内容が多くて「趣味でやってみました」みたいな話がなかった気がします。特に大規模ということでもありませんが、スーパーコンピュータの監視をZabbixでやっていたイスラエルの発表はおもしろかったですね。普通だと専用のベンダーのツールとかでやるんだろうと思いますが、そこをZabbixとダッシュボードで実際に例を見せて解説していました。

●参考:Monitoring Small HPC with Zabbix

トヨタもNTTコム エンジニアリングも大規模運用における監視システムという部分では共通するシステムだが、トヨタはあくまでもR&Dの実験、NTTコム エンジニアリングは失敗談というように方向性はだいぶ異なる内容となった。どちらも非常に注目されたセッションだったと言えるだろう。

著者
松下 康之 - Yasuyuki Matsushita
フリーランスライター&マーケティングスペシャリスト。DEC、マイクロソフト、アドビ、レノボなどでのマーケティング、ビジネス誌の編集委員などを経てICT関連のトピックを追うライターに。オープンソースとセキュリティが最近の興味の中心。

連載バックナンバー

働き方インタビュー
第4回

Zabbix Summit番外編:Zabbixで働く女性エンジニアにインタビュー

2023/12/27
Zabbix Summit 2023の番外編としてZabbixで働く女性エンジニアにインタビューを行った。
運用・管理インタビュー
第3回

Zabbix Summit 2023に日本から参加したスピーカーにインタビュー

2023/12/21
Zabbix Summit 2023にスピーカーとして参加したトヨタ、NTTコム エンジニアリングのエンジニアにインタビューを行った。
運用・管理イベント
第2回

Zabbix Summit 2023から、Kubernetes配下でのインフラモニタリングを解説するセッションを紹介

2023/12/19
Zabbix Summit 2023から、Kubernetes配下でのインフラモニタリングを解説するセッションを紹介する。

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています