CloudWatchと監視の話
AWSの各種リソースの状況を監視できるサービスです。
オンプレだとNagiosやZABBIXなどで監視サーバーを立てるしかありませんでしたが、AWSではある程度の監視ならこのCloudWatchで事足ります。Nagiosのあの難解なテキストでつくられたconfigを慎重に触ることを考えるとおそろしく楽ですね..
コンソールを開いてみる
CloudWatchのコンソール画面に移動します。
ダッシュボード
ダッシュボード→EC2をクリックします。
EC2インスタンスのCPU使用率、Disk Read/Writeバイト数、NetworkのIOなどがグラフで見られます。
メモリの使用量は「カスタムメトリクス」を作成しないと監視できません。
EBS(Elastic Block Storage)の状況です。EBSとはEC2インスタンスにアタッチして使用するボリュームのことでした。
CloudWatch Logs
「ログ」というメニューからは、CloudWatch Logsという機能が使えます。
EC2インスタンスにエージェントをインストールして、各種ログを収集してくれる機能です。例えば/var/log配下のログなど、インスタンスにログインしなくともここからログを検索したりできます。
メトリクス
メトリクスメニューからは、監視している要素が1つずつ見られます。
アラーム
メトリクスに対して閾値を決めて、アラームを設定したりできます。
複業の話
別記事で書きますが、複業の方で管理するWebサイトが一気に増えてきたので(有り難いことです)監視をZABBIXで行おうとしています。うちはWebデザインだけの会社ではないので、インフラの監視や改善提案もやります。
いずれはMackerelなどの外部のSaaS監視サービスに移行したいですが、今はコストをかけられないので自社で監視したいと思います。移行した後も監視サービスの二重化になるので損にはなりませんし(通常片方を止めておけばコスト面は問題無い)
当たり前ですけど、外部のサービスって止まれば監視できなくなるので、依存したくないです。Mackerelさんの基盤はAWSのようなので、同じ基盤同士で監視するのって結構リスクあると思います(同じリージョン上で障害があった場合システムも監視も止まる)
自社で違うリージョンとかに予備の監視システムを構築しておく。くらいのことはした方が良いと思いますけどね。
記事数が100を超えました
クラウドも、Webデザインも、写真撮影や空撮も、何も知らない、全く出来ない状態でスタートしています。出来るようになるまで続けるだけです。出来ないのは続けていないからです。