めったに聞かないAWSの大規模障害

AWSではあまり聞かない、障害発生事案がありましたつい最近。

Amazon Web Services(AWS)はいろんな会社さんが販売していますし、周辺でもその安定性や信頼性は高いように感じています、いつもオンプレミスのほうがいいのではという話は付いて回るのですが。
絶対に落ちないサービスはないということで、カオスエンジニアリングという絶対落ちないならあえて断続的に意図して落としてしまう方法なんかもあるわけです、実に理に適う話でもあります。

そんなわけでいろんなサービス、銀行のオンライン画面もそう、スマホゲームもそう、通常のサーバなんかも告知を入れた上で深夜メンテナンスが多いのですが、でないといつメンテするのか疑問になるわけです。
「制御システムの障害による冷却システムの故障」などはこの暑さだとよくわかっていますし、そのため10年前くらいなら自宅のサーバ冷やすために毎日がんがんエアコンかけてるエンジニアの話も聞いたことがあります、デジタルものも物理的なものに弱いのです。

100%なんて無理なのでそのための対処方法、事前方法、事後方法、いつも悩みますしこのへんはいつも課題。

関連しているブログ記事一覧