AWSの大規模障害
2019年8月23日昼頃にはAmazonが提供するクラウドサービス「Amazon Web Services(AWS)」の東京リージョンで大規模障害が発生しました。 同日午後18時に仮想マシン「EC2」の大部分を復旧、午後10時にリレーショナルデータベースサービスを復旧させたとのコメントを発表しました。
AWSによると、この大規模障害は東京リージョンを構成するデータセンターの1つで発生したとされています。 EC2の障害やリレーショナルデータベースの接続性の問題が起きたといわれています。 この状態によって楽天やユニクロなどの大企業を含む多くの企業がトラブルに巻き込まれました。
大規模障害の原因は「空調管理システムの障害」による冷却装置の故障とされています。 この冷却装置の故障によってEC2用のホストサーバーの一部がオーバーヒートを起こし、シャットダウンすることでEC2やディスクに障害が出ました。
サーバールームの冷却装置の重要性
このAWSの大規模障害によって、サーバールームの冷却装置の重要性が再び注目されるようになりました。 サーバールームの熱対策としてまず挙げられるのが空調です。 空調の温度設定を下げ、部屋全体の温度を下げるのは簡単ですが、コストが増大してしまいます。
そこでまず空調を下げるより熱を逃がす方法を考えるのが大切とされています。 冷気の通り道と暖気の通り道を分けて作れるように、ラックの向きと列を揃えることが重要です。 これによって効率的に熱を逃がし、最終的に天井のファンによって熱を散らします。
また空調機は床下送風がおすすめとされています。 床下送風は複数のラックに効率的に冷気を送れるので、全体を冷やせます。 さらに発熱量が多いサーバー機は、空調機に近い場所ではなく、真ん中に設置するのがおすすめです。
隣接したラックが壁になることで、排熱が全面に回り込みにくくなります。 また中央部は床下送風で最も冷風を取り込みやすい部位とされています。
サーバールームの冷却装置はこまめにチェック
AWSのように多くの対策がなされている大手のデータセンターでも、障害が起こってしまいます。 このような障害を起こさないために、冷却装置の重要性が改めて注目されました。 この機会に自社の冷却装置が効率的に設置されているか見直してみてはいかがでしょうか。
この記事の監修者・著者
-
未経験からITエンジニアへのキャリアチェンジを支援するサイト「キャリアチェンジアカデミー」を運営。これまで4500人以上のITエンジニアを未経験から育成・排出してきました。
・AWS、salesforce、LPICの合計認定資格取得件数:2100以上(2023年6月時点)
・AWS Japan Certification Award 2020 ライジングスター of the Year 受賞
最新の投稿
- 2024年3月26日キャリア・転職保安職(自衛官・警察・消防官など)に向いている人の性格・特徴ランキング【現役保安職(自衛官・警察・消防官など)36人が回答】
- 2024年3月26日キャリア・転職保安職(自衛官・警察・消防官など)に必要なスキルランキング&スキルアップの方法とは?【現役保安職(自衛官・警察・消防官など)36人が回答】
- 2024年3月26日キャリア・転職クリエイター職(ライター・デザイナー・編集)に向いている人の性格・特徴ランキング【現役クリエイター職(ライター・デザイナー・編集)64人が回答】
- 2024年3月26日キャリア・転職クリエイター職(ライター・デザイナー・編集)に必要なスキルランキング&スキルアップの方法とは?【現役クリエイター職(ライター・デザイナー・編集)64人が回答】