この記事の目次
AWSのデータを守ってくれる金庫番Vaultとは?
Amazonの代表的クラウドサービスAWS(Amazon Web Service)では、高いセキュリティと信頼性を確保しながら、グローバルネットワークを基盤として、データの収集から保管まで一貫したサービスを提供しています。
AWSから日々流れてくるデータは、ユーザーが構築したアプリケーションで処理される前に、AWSのオブジェクト保管サービスAmazon S3(Simple Storage Service)Glacierを介して保管されます。
Amazon S3 Glacierの中で、いろいろなデータ利用ポリシーに対応するために、データ保管を進めてくれるのがVaultです。
これから、AWSでのデータ保管についてお話ししていく中で、ぜひVaultについて理解を深めていってください。
AWSのデータ保管(1): Amazon S3とは?
Amazon S3 Glacierの元となるAmazon S3は、AWSデータの収集から管理までを行うデータ保管サービスです。
Amazon S3を使って、データレイク、Webサイト、モバイルなどから流れてくるデータをどのように保管しているのか、その機能と仕組みをお話しします。
S3 Object Lambda
S3 Object Lambdaは、集めたデータがS3からアプリケーションに流れる前に、AWS Lambdaを使うアプリケーションで処理できるように、特定のコードを付けるものです。
この処理では、ユーザーのリクエストに沿ってデータ様式を変えるだけで、アプリケーション環境自体を変更する必要はありません。
S3 Storage Lens
S3 Storage Lensは、Amazon S3の使用状況とアクティビティの傾向を可視化して分析することにより、データのセキュリティ面やコスト面から保管条件を最適化するものです。
分析結果は、組織ごとに具体的な文章で指示されますので、その指示にきちんと対応することで、データのセキュリティが確保され、データ保管に関わる経費が節減できます。
S3 Intelligent Tiering
S3 Intelligent Tieringは、アプリケーションへのアクセス状況により、使用頻度による4つのカテゴリに分け、高頻度のものから優先して処理の効率化を図るものです。
使用頻度による4つのカテゴリとは、アクセスの高頻度アクセスと低頻度アクセスそれぞれの低レイテンシーアクセス層、同期されない2つの受信許可を必要とするオプトインアーカイブアクセス層のことをいいます。
S3 Access Points
S3 Access Pointsは、共有データセットの個別アクセスポイントを作ることによって、ユーザーのリクエストに従ったサービスを運用するものです。
限定されたVPCを経由することによって、クラウドで膨大なアプリケーションが動いても、効率的にサービスが行われます。
S3バッチオペレーション
S3バッチオペレーションは、複数の個別ジョブを作り、優先順位をつけて作業を進めるとともに、作業証跡などのレポートを作るものです。
この個別ジョブは、数十から数十億個まで実行可能なオブジェクトリスト、実行するアクションとパラメータから成り、オブジェクトを大規模に管理することができます。
S3パブリックアクセスブロック
S3パブリックアクセスブロックは、S3バケットレベルまたは全体のAWSアカウントのパブリックなアクセスを制御できるものです。
パブリックなアクセス権は、アクセスコントロールリスト、バケットポリシーまたはその両方で付与されますが、この対応により、現在も将来もオブジェクトがパブリックにアクセスされなくなります。
AWSのデータ保管(2):Amazon S3 Glacierとは?
AWSから日々流れてくるデータには、テキストデータ、画像データ、動画データ、ログデータなど、いろいろな属性を持っています。
データには、複数のアプリケーションで処理されていくデータもあれば、処理された結果として保管されるデータもあります。
Amazon S3 Glacierは、Amazon S3の一部として、データのバックアップやアーカイブを行うデータ保管サービスです。
これから、AWSデータの保管庫Amazon S3 Glacier導入のメリットと、Amazon S3 Glacierの中で、いろいろなデータ利用ポリシーに対応するためにデータ保管を管理するVaultについてお話しします。
Amazon S3 Glacier導入のメリットは?
Amazon S3 Glacierは、Amazon S3 Glacier Deep Archiveとともに、アーカイブや長期的にバックアップするための高い安全性と耐久性を確保した保管サービスです。
保管されるデータは、Amazon S3と比べてアクセス頻度が少なく、特に低レイテンシーを要求されていないものです。
Amazon S3 GlacierとAmazon S3 Glacier Deep Archiveそれぞれのデータ取得速度範囲オプションとして、分~数時間レベルで3つ、半日~2日レベルで2つが準備されています。
これから、5つのAmazon S3 Glacier導入メリットについてお話ししていきます。
スピーディにデータが取得できます
Amazon S3 Glacierのストレージクラスには、高速取得、標準取得、バルク取り出しがあります。
特に、高速取得では、1~5分でデータが取得できますので、アクティブアーカイブのようなユースケースに適しています。
標準取得では3~5時間、バルク取り出しでは5~12時間で取り出すことができ、それぞれ時間的制約がないデータや大量のデータ取り出しに有用です。
耐久性とスケーラビリティに優れています
Amazon S3 Glacier と S3 Glacier Deep Archiveのストレージクラスのクラウドインフラストラクチャは、グローバルレベルで実行されています。
高い耐久性が実現でき、データは個別のAWSリージョン内で地理的に分離された少なくとも3つのアベイラビリティゾーンに分散されます。
高度で包括的なセキュリティ機能とコンプライアンス機能を提供します
Amazon S3 Glacier と S3 Glacier Deep Archiveのストレージクラスは、監査ログのAWS CloudTrailへの統合や、暗号化に対する柔軟な対応とともに、世界標準に対応できるコンプライアンス認証をサポートします。
ただし、監査ログは、ストレージAPIコールのアクティビティを記録しています。
コストを低く抑えることができます
Amazon S3 Glacier と S3 Glacier Deep Archiveは、設計上、低いコストのAmazon S3ストレージクラスとなっています。
このため、データレイク、IoTデータ、機械学習、メディアセットのアーカイブなどの多様なユースケースに沿って、容量が大きいデータを低コストで保持することができるのです。
多くのパートナーと柔軟に連動するサービスを提供します
Amazon S3のオブジェクトストレージサービスには、ほとんどのAWSサービスが統合しているほか、AWSパートナーネットワークのパートナーや、数多いコンサルティング、システムインテグレーターなども参加しています。
これほど多くのパートナーと柔軟に連携できるソリューションプロバイダーはありません。
Vaultとは何か?
AWSに保管するメリットは、AWSそのもののメリットとも重なりますが、高いセキュリティの下で、スピーディなセットアップや柔軟なスケーラビリティを実現できる、低コストのデータ保管環境の提供が実現できることです。
Amazon S3 Glacierでは、Archive(アーカイブ)として長期間データを保管しますが、このArchiveをまとめてグループ化したものをVault(ボールト)と呼び、AWSの1アカウントで1,000個までのVaultが使えます。
これから、ArchiveとVaultについて簡単に触れたあと、Amazon S3 Glacier上でのVaultの役割についてお話ししていきます。
ArchiveとVaultとは?
Amazon S3 Glacierでは、データはArchiveとして保管され、グループ化されたArchiveを保管するためのコンテナがVaultと呼ばれるものです。
それぞれのArchiveは、ユーザーのリクエストに沿ったVaultに保管されます。
保管するデータへのアクセスは、AWS Identity and Access Management (IAM)サービスを使ってVaultレベルでアクセスポリシーを設定することでコントロールできるようになります。
また、Amazon Simple Notification Service(Amazon SNS)を使って、取り出したいデータがダウンロードできる状態であることを通知することもできます。
Amazon S3 Glacier上でのVaultの役割とは?
Archive保存のコンテナであるVaultを導入することで、クラウド系全体に対してどのようなインパクトを与えるのでしょうか?
基本的に、Vaultに関わるアクティビティは、AWS SDK(Software Development Kit)を使ってハンドリングされます。
Vaultに関わるアクティビティには、作成、削除、ロック、インベントリ情報の取り出し、フィルタリング用タグ付けなどがあります。
Vaultに関わるアクティビティの結果、クラウド系全体に与えられるインパクトについてまとめてみます。
Vaultはクラウド系にどのようなインパクトを与えるのか?
Vault導入に伴い、クラウド系に対して、監視強化によるセキュリティ確保、アクセス権実行によるコンプライアンス強化、効率的なリソースとコスト管理という大きなインパクトを与えます。
・Vault作成:IAMポリシーによる柔軟なAmazon S3 Glacierへのアクセス権が付与できます。
・Vault削除:最終インベントリ作成時点でArchiveがなく、以降Vaultへの書き込みがないことが確認できます。
・Vaultロック:書き込み不可のポリシーを適用することにより、コンプライアンスが確保されます。
・Vaultインベントリの取り出し:災害対策や不定期な照合のため、1日に1回更新されるインベントリをJSONまたはcsvで受け取ることができます。
・Vaultフィルタリング用タグ付け:リソースとコスト両面から、カテゴリを指定してAmazon S3 Glacierの使用実績管理が可能です。
Amazonクラウドの中で、VaultはAWSのデータを見守ってくれています!
AWSから日々流れてくるデータは、ユーザーが構築したアプリケーションで処理される前に、Amazon S3 Glacierを介して保管されます。
Amazonクラウドの中で、Vaultは毎日しっかりとデータ保管を進めてくれています。
データの処理時間や容量などによって、ユーザーのリクエストは多岐に亘りますが、それらのリクエストに柔軟に対応できるのも、Vaultが日々クラウドを見守ってくれているからです。
この記事の監修者・著者

-
未経験からITエンジニアへのキャリアチェンジを支援するサイト「キャリアチェンジアカデミー」を運営。これまで4500人以上のITエンジニアを未経験から育成・排出してきました。
・AWS、salesforce、LPICの合計認定資格取得件数:2100以上(2023年6月時点)
・AWS Japan Certification Award 2020 ライジングスター of the Year 受賞