IT分野の『モニタリング』とは、システムの正常稼働をサポートする監視機能です。企業や公共サービスのネットワークシステムにおいて、大規模障害のリスクを軽減します。モニタリングの目的・方法・重要性について理解を深めましょう。
モニタリングの意味は?
モニタリングとは、広義の意味では『対象となるものを観察・測定・分析すること』であり、さまざまな業界で使われている言葉です。IT業界におけるモニタリングの意味や重要性を解説します。
システムなどを監視・観察すること
IT分野でのモニタリングとは、主に『コンピューターやシステムを監視・観察すること』です。稼働や性能の正常性・障害の有無・セキュリティーなどをチェックします。
データ収集による現状把握後の変動・動向予測も、モニタリングにおける目的の一つです。現状だけでなく継続的な正常性を保つために、あらゆる角度から包括的な確認が行われます。
モニタリングは、専用のツールやサービスを利用して行うのが一般的です。信号やデータをネットワーク経由でシステムに送信し、反応から現状をチェックする方法が主流です。
機器の稼働状況のみを確認したり、セキュリティーの状態を把握したりするツールもあります。網羅的なモニタリングを行うためには、監視項目を分けて設計する方法が有効です。
モニタリングの重要性
夜間や長期休暇中にシステム障害が発生すると、対応が遅くなる可能性があります。しかし、モニタリングシステムを導入していれば、アラート機能で早期の対応が可能です。
モニタリングには、CPUやメモリなどリソースの使いすぎを知らせてくれる機能があります。リソース不足でサーバーがダウンするリスクを減らすためには、モニタリングの導入が不可欠です。
近年は、企業だけでなく行政サービスや病院でもネットワークシステムを導入しています。システム障害への対応が遅れると、多くの人の生活にも悪影響を及ぼしかねません。
信用の失墜やブランドイメージの毀損を防ぐためにも、モニタリングによる日々のシステム監視が重要なのです。
モニタリングの目的
モニタリングの主な目的は、『動作』『障害』『セキュリティーの監視』です。それぞれがどのように行われるのかを解説します。
正常に動作するか
モニタリングの動作確認では、ネットワークやサービスの応答の有無をチェックします。信号やデータをネットワーク経由で送信し、レスポンスから状況を判断する仕組みです。
動作確認で利用される技術は、監視要件により異なります。通常の業務に支障を来さないよう、監視する間隔を考慮することも重要です。
稼働の正常性を確認する際は、ネットワークの性能もチェックします。サービスの性能はネットワークのレベルに左右されるため、ネットワークの性能監視は重要度が高めです。
稼働の有無や性能チェックを行うことで、正常時の状態が分かります。ネットワークやサービスの異常を判断するには、正常時の状態を正確に把握しておくことが重要です。
エラーが起きていないか
システムに何らかのエラーが起きていないか、監視することも重要です。ハードウェアやソフトウェアのログなどを確認しながら、システムの正常性や障害予想を監視します。
障害監視の技術には、SNMPやsyslogを活用するのが一般的です。SNMPはネットワークを管理し、syslogはOSやアプリケーションのログを管理します。
エラーが発生した場合は、緊急性や発生頻度により担当者へアラートを通知するのが基本です。自動処理が可能な障害なら、再起動など状況に適した処置が行われます。
セキュリティーに問題がないか
インターネットにつながったシステムは、ウイルスや不正アクセスなどの脅威にさらされた状態です。モニタリングでセキュリティーリソースを監視することで、ネットワークセキュリティーのアラートをチェックできます。
Firewall・IDS・IPSなど、セキュリティーリソースの種類はシステムによりさまざまです。モニタリングで適切な監視を行えば、基準違反のリソースを発見できます。
セキュリティーアラートは頻繁に発生するのが一般的です。フィルタリングにより検知レベルを調節するなど、大量アラートへの対応が求められます。
モニタリングの方法
モニタリングの動作監視では、主に信号やデータを送信する方法が採用されています。性能監視ではリソースデータを収集・分析し、将来的な障害を予測することが可能です。
信号やデータを送信
動作確認の方法として代表的な例が、信号やデータを送信し反応を見る方法です。
応答がない場合は、対象機器かネットワークのいずれかに異常が発生していると考えられます。同じ経路で別の機器に信号やデータを送信し、反応が得られた場合はネットワークが正常であると推測が可能です。
監視対象となる主なものは、サーバー・ネットワーク機器・アプリケーションが挙げられます。ハードウェアに関しては、物理的な故障の発生も監視対象です。
データを収集して予測
モニタリングの性能監視では、OSやサーバーのデータを収集し、障害を予測することが可能です。CPUやメモリなどリソースの使用状況を、過去の蓄積データと照らし合わせ、サーバーダウンなどのシステム障害に備えます。
モニタリングの予兆検知機能は、クラウド型のシステムで高い効果を発揮します。異常の兆候が見られたときに、クラウド型ならすぐにリソースを追加することが可能です。
工場の生産設備では、故障発生確率を算出するためにモニタリングの性能監視が行われています。各種インフラや自動車、人の健康状態にも適用できる技術です。
モニタリングを行う際のポイント
モニタリングでの監視を頻繁に行うと、通信量が増加します。通常の業務に与える影響を考慮し、最適な監視間隔を設定することが大事です。
モニタリングで監視できるものは多岐にわたり、何を監視するかでシステムも異なります。監視ツールには、社内にシステムを構築する『オンプレミス型』とネット上にシステムが存在する『クラウド型』があります。
それぞれの特徴を理解し、監視対象を検討した上で、最適なツールを導入することが重要です。
構成/編集部