カテゴリー
AWS Cloud Watch EC2

AWS システムステータスチェックエラー時にEC2を自動復旧する

今回のゴール

EC2のシステムエラーチェック時にEC2を自動復旧する設定を行います。

システムエラーチェックの要因は下記のものがあります。

  • ネットワーク接続の喪失
  • システム電源の喪失
  • 物理ホストのソフトウェアの問題
  • ネットワーク到達可能性に影響する、物理ホスト上のハードウェアの問題

復旧後のインスタンスは復旧前と比べて何が違うのでしょうか?
公式サイトでは下記のように記述されておりました。

復旧されたインスタンスは、インスタンス ID、プライベート IP アドレス、Elastic IP アドレス、すべてのインスタンスメタデータを含め、元のインスタンスと同じです。

正常に機能していないインスタンスにパブリック IPv4 アドレスが割り当てられている場合は、そのインスタンスの復旧後も、パブリック IPv4 アドレスは保持されます。

障害のあるインスタンスがプレイスメントグループ内にある場合、回復されたインスタンスはそのプレイスメントグループ内で実行されます。

インスタンスの復旧

特に何も変わることは無いようですね。
“復旧”ではENIが維持されたままになりますのでMACアドレスが変わることもないようです。

設定

CloudWatchアラームの作成

EC2サービス-[インスタンス]メニューで、インスタンスを選択して、[アクション]-[モニタリングとトラブルシューティング]-[CloudWatchアラームの管理]を選択します。

[アラーム通知]:SNSトピックを選択
[アラームアクション]:復旧

【アラームのしきい値】
[Group samples by]:平均
[Type of data to sample]:ステータスチェックの失敗:システム
[連続した時間]:2
[期間]:5分
[アラーム名]:alarm_ec2_system_recovery

確認

復旧の動作を確認しようとテスト方法を色々と調べてみましたが、できないようでした。

運用上で実際に復旧された時に追記しようと思います。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です