なぜ監視が必要か

「サーバーが止まった」「ネットワークが遅い」——障害にユーザーより先に気づくことが監視の目的です。障害が発生してからユーザーに報告されるまでの間に、情シスが検知して初動対応を始められれば、ダウンタイムを最小化できます。

  • 障害の早期検知:サーバーダウン、ディスク容量逼迫、メモリリーク等を即座に検知
  • 予兆の把握:CPU使用率の緩やかな上昇、ディスク空き容量の減少傾向を事前にキャッチ
  • 原因分析:障害発生時の状況をログ・メトリクスから振り返り、根本原因を特定
  • キャパシティプランニング:リソースの使用傾向から、増強のタイミングを予測

監視の種類

種類対象方法検知できること
死活監視(Ping監視)サーバー、ネットワーク機器ICMP Pingで応答を確認サーバーダウン、ネットワーク断
リソース監視CPU、メモリ、ディスク、ネットワーク帯域エージェント or SNMP過負荷、容量逼迫、メモリリーク
サービス監視HTTP、HTTPS、SMTP、DNS等ポート監視、URL監視Webサイトダウン、メール障害
ログ監視Windowsイベントログ、syslog、アプリログログ収集・パターンマッチエラーの発生、不正アクセスの兆候
APM(アプリ性能監視)Webアプリの応答時間、エラー率APMエージェントアプリの性能劣化、エラー率上昇

監視ツール比較

ツール種別費用特徴適したケース
ZabbixOSS(オンプレ)無料(自前運用)高い拡張性、エージェント/SNMP対応、テンプレート豊富オンプレサーバーが多い企業
DatadogSaaS$15〜/ホスト/月クラウドネイティブ、700+インテグレーション、APM統合クラウド中心の企業
Azure MonitorSaaS(Azure)従量課金Azure環境と完全統合、Log Analytics、Application InsightsAzure利用企業
MackerelSaaS(国産)¥1,833〜/ホスト/月日本語UI・サポート、はてな運営国内企業、日本語サポート重視
Uptime RobotSaaS無料〜$7/月外部からのURL監視・ポート監視に特化Webサイトの死活監視のみ
PRTGオンプレ/クラウド100センサーまで無料SNMPに強い、ネットワーク機器の監視に最適ネットワーク機器が多い企業
💡 中小企業の監視スタート

まずはUptime Robot(無料)でWebサイト・SaaSの外部監視を始め、次にAzure MonitorまたはZabbixでサーバーのリソース監視を追加するのが、コストを抑えた段階的アプローチです。

監視設計のポイント

  • 何を監視するかを決める:全部監視しようとせず、ビジネスインパクトの高い対象から優先(メールサーバー、基幹システム、VPN等)
  • ベースラインの取得:正常時のCPU使用率、メモリ使用量、ディスクI/Oを1週間計測し、閾値設定の基準にする
  • 監視間隔:死活監視は1〜5分、リソース監視は5分、ログ監視はリアルタイムが基本
  • データ保持期間:メトリクスは最低90日、ログは最低30日保持。コンプライアンス要件があれば1年以上

アラート設計

監視ツール導入後の最大の課題は「アラート疲れ」です。重要でないアラートが大量に飛ぶと、本当に重要なアラートを見逃します。

レベル条件例通知先対応
Critical(緊急)サーバーダウン、ディスク使用率95%以上電話+SMS+メール即時対応
Warning(警告)CPU 80%以上が10分継続、ディスク80%以上メール+Slack当日中に確認
Info(情報)バッチ処理完了、バックアップ成功ダッシュボード記録のみ対応不要
  • 閾値は段階的に設定:Warning → Criticalの2段階で通知
  • フラッピング防止:閾値を行ったり来たりする状態で連続アラートが飛ばないようヒステリシス(復旧閾値)を設定
  • メンテナンス時間の設定:計画メンテナンス中はアラートを抑制

外部監視サービス

自前で監視ツールを運用するリソースがない場合、外部のMSP(Managed Service Provider)に監視を委託する選択肢もあります。月額5〜15万円程度でサーバー・ネットワークの24時間監視と一次対応を委託できます。

まとめ

監視は「死活監視 → リソース監視 → ログ監視」の順で段階的に導入します。Uptime Robotで外部監視を始め、Azure Monitor or Zabbixでサーバー監視を追加。アラート設計はCritical/Warning/Infoの3段階で「アラート疲れ」を防ぎましょう。

E

BTNコンサルティング 編集部

株式会社BTNコンサルティング|情シス365 運営

Microsoft 365・Google Workspace導入支援、IT-PMI(M&A後のIT統合)、セキュリティ対策を専門とするITコンサルティング企業。中小企業の「ひとり情シス」を支援し、ITの力で経営課題を解決します。