ある日いきなりサーバー管理者に任命されたら
もしものために押さえておきたい「DNS」と「データバックアップ」
著者のこれまでのサーバー管理経験から、今回あえてDNSおよびデータバックアップについて取り上げておこうと思います。これらは障害時の影響が大きいのに頻繁に事故が起こる可能性があるため、ぜひ押さえておきたい重要なポイントだと考えたからです。
DNSは単にドメイン名とIPアドレスの関連付けを提供するだけのサーバーですが、非常に多くのサービスがDNS参照を行っているため、DNSを引けなくなると影響は甚大です。例えばクライアントからサーバーに対して何らかのサービスにアクセスした際、5秒くらい固まった後エラーが返って来るというパターンは、サーバーからDNS参照ができなくなっている状況であることが多いです。
そういう理由から、新米サーバー管理者の方々にはぜひ一度、すべてのサーバーのDNS設定(UNIX系OSであれば/etc/resolv.conf)をチェックしてみてほしいと思います。たまに、すでに存在しないDNSサーバーのIPアドレスが記されていることや、上位DNSサーバーとして現在サービスが停止しているかもしくはレスポンスが遅いDNSサーバーのIPアドレスが記されている場合があります。こういった場合はそのサーバーのレスポンスが遅く感じられるので直しておくようにします。
データバックアップはサーバーが何らかの理由で壊れてしまった場合にデータを復旧することができる最後のとりでです。しかしながら一度稼働してしまったらそのサーバーのバックアップが正しく機能しているか確認する機会がなくなってしまいます。
またバックアップ自体はきちんと取れているが、重要なデータのバックアップが取れていなかったり、バックアップ頻度が不適切だったり、もしくはバックアップ先の空き容量がまもなく尽きてしまうなんてこともたまにあります。
それらの事情から、データバックアップについても新米サーバー管理者の方々にはぜひ一度すべてのサーバーをチェックしてみてほしいと思います。
サーバー管理者にとって障害対応は最大の腕の見せ所ですが、バックアップがうまく行われていないとどんなにすご腕のサーバー管理者であっても障害復旧が非常に困難になります。
チーム作業を意識してまわりの信頼を得ることも重要
サーバー管理は技術色の強い職種ですが、一方でチーム作業という側面もあります。所属している組織がどのような業務プロセスや手法を使ってサーバーを管理しているか理解し、それに適応する必要があります。適応すべき内容は組織によって異なりますが、おおよそ以下のものが含まれてきます。
・日常監視のやり方
・機器増強時の一連のプロセス
・エンドユーザーからの問い合わせに対する回答のプロセス
・障害対応時の連絡
・よく起こる障害の対応方法
・日報や週報の書き方
技術の習得も重要ですが、それにも増してチーム内の協調が重要になります。もしサーバー管理者に任命された後、現状把握の段階で非効率な業務プロセスを見つけたとしても、しばらくはそれまで通りの業務プロセスでしっかりこなし、仲間の信頼を得た段階であらためて業務プロセス改善を提案するのがスムーズにいくコツのようです。
最後になりますが、サーバー管理の仕事は幅広いため、最初からすべての仕事を理解するのは不可能です。サーバー管理者の世界は一人前と呼ばれるようになるのに時間がかかりますので、あせらずに一歩一歩着実に成長していきましょう。
本記事がサーバー管理者になる皆さんの最初の一歩としてお役に立てたら幸いです。