2021/04/26

AWS Data Exchangeとは?特徴や2種類の使い方をご紹介

 
  

AWS Data Exchangeとは


Amazon Web Services(AWS)のData Exchangeは、クラウド上でデータセットをやり取りするサービスです。

公開されている第三者機関のデータをAWSクラウドへ取り込み、分析したり機械学習に活用したりできます。または、手持ちのデータをアップロードして、ユーザーへ配布・共有できます。

AWS Data Exchangeの特徴


この項目では、AWS Data Exchangeの特徴についてご紹介します。

サブスクライバー(取得する側)向けのタイプと、プロバイダー(公開する側)向けのタイプに分かれます。

サブスクライバー向けData Exchangeの特徴

サブスクライバー向けのData Exchangeでは、AWS MarketplaceやData Exchangeにアップロードされているデータセットを取得できます。

ただ取得可能にするだけでなく、データを活用するためのサポート機能も搭載されています。

特徴1:さまざまな種類のデータを取得できる

Data Exchangeは、さまざまな種類のデータを取得できます。

金融サービス、ヘルスケア、小売、ライフサイエンス、メディア、エンターテイメントなど、幅広い業界からデータが提供されています。また、提供元では企業、政府、学術機関、研究機関といったさまざまな形態の組織が存在します。

これらから欲しい分野のデータを検索して、簡単にクラウドへ取り込めます。

特徴2:データへのアクセスの高速化

Data Exchangeは、データへのアクセスを高速化します。

AWSにアップロードされているデータは、クラウド上で直接アクセスできます。プロバイダーが個別に用意した配信先に出向く必要がなくなるため、各配信先に合わせて認証情報を作成したり、システムをカスタマイズしたりする手間が省けます。

特徴3:AWSサービスでデータを処理できる

Data Exchangeでは、AWSのサービスを用いてデータを処理できます。

AthenaやRedshiftでの分析、EMRでのビッグデータ処理、Glueでのデータ統合、Sagemakerでの機械学習モデルの構築、Lake Formationでのレイクの構築など、さまざまな形で活用できます。

この他、CloudWatchと統合することで、新しいバージョンが公開された時に自動で更新できるようになります。

なお、Data Exchangeで取り込んだデータを処理するには、Simple Storage Service(S3)へエクスポートしておく必要があります。事前に行っておきましょう。

プロバイダー向けData Exchangeの特徴

プロバイダー向けのData Exchangeでは、手持ちのデータをアップロードしてユーザーに公開できます。

アップロードの簡易化、セキュリティの強化といったサポート機能も搭載されています。

特徴1:アップロードが簡単

Data Exchangeは、データセットのアップロードが簡単にできます。

Marketplaceに登録し、AWSから認定を受ければアップロードを開始できるようになります。その後、アップロードしたいデータセットを選択すれば、セットがパッケージ化・公開されます。

このように、少ない手順でアップロードおよび公開を完了でき、配信のためのシステムを構築する必要もなくなります。

また、APIを使用することで、新しいリビジョンの公開を自動化することも可能です。

特徴2:特定の顧客に向けたデータセットを提供できる

Data Exchangeでは、特定の顧客に向けたプライベートのデータセットを提供できます。

カスタムオファーというオプションを用いて実行します。提供先となるアカウントを指定することで、そのアカウントにのみデータセットを公開できます。特定の相手とだけやり取りをしたい場合や顧客に合わせてカスタマイズしたデータを送りたい場合などに適します。

特徴3:セキュリティが充実

Data Exchangeは、セキュリティ機能が充実しています。

保存及び転送されるデータは、すべてSSL/TLSによって暗号化されます。また、サブスクリプション検証機能が存在し、ユーザーのアクセス許可、知的財産権の保護、コンプライアンスなどの設定・管理が行えます。

さらに、CloudTrailと統合することでAPI呼び出しのログを記録できます。

これらの機能により、データを保護し安全な配信を可能にします。

AWS Data Exchangeの使い方


この項目では、AWS Data Exchangeの使い方についてご紹介します。

サブスクライバー向けとプロバイダー向けで、使い方は異なります。

ここでは簡単な流れを紹介しています。

データセットを取得する方法(サブスクライバー向け)

ここでは、Data Exchangeでデータセットを取得する方法について説明します。

データセットをフォームから検索して、ニーズに合うものが見つかれば取得する、という流れになります。

データセットを検索

カタログまたはMarketplaceから取得したいデータセットを検索します。キーワードまたはカテゴリで絞り込みができます。

オファーを受けている場合は、製品オファー(product offers)のページから確認・取得できます。

なお、希望するセットが見つからなかった場合は、AWSにリクエストを出すことも可能です。取り扱って欲しいジャンルがあれば、要望してみましょう。

サブスクライブ

データセットが見つかったら、それをサブスクライブしてセットを取得します。

価格と機関の組み合わせや自動更新の可否を選択して[Subscribe]ボタンをクリックすることで、セットの取得を開始します。取得が完了すると、データへのアクセスが可能になります。

なお、プロバイダー側がサブスクリプション検証を有効にしている場合は、リクエストして承認を得る必要があります。

データセットを公開する方法(プロバイダー向け)

ここでは、Data Exchangeでデータセットを公開する方法について説明します。

プロバイダー登録→データセットを作成→公開、という流れになります。

公開する際は、データセットの内容が利用規約の要件を満たしている必要があります。違反がないか確認しておきましょう。

プロバイダーとして登録

最初に、AWSにプロバイダーとして登録します。

前提条件として、Marketplaceで販売者としてサインアップする必要があります。未登録の場合はサインアップしておきましょう。

Marketplaceへのサインアップが完了したら、Data Exchangeを利用するための認定リクエストを送信します。AWS側から認定の連絡を得られれば、データセットの作成が可能になります。

データセットの作成

次に、データセットを作成します。

コンソールからウィザードを開き、セットの名前と説明文を入力して[Create]ボタンをクリックします。名前と説明文はカタログから詳細ページを開いた時に表示されるので、ユーザーに分かりやすいように記述しておきましょう。

セットの作成・設定を終えたら、その中にリビジョンを作成します。そこへ公開したいデータをS3または自身のコンピューターからアップロードすれば、公開の準備は完了です。

データセットの公開

データのアップロードを完了したら、それを公開します。

公開する範囲と機密情報に関するカテゴリを選択した後、名前、ロゴ、問い合わせ先、Webアドレス、データのカテゴリ、説明文などの情報を入力します。さらに、アクセスルール、価格、期間、サブスクリプション検証(オプション)などを設定していきます。

これらのプロセスを完了して[Publish]ボタンをクリックすれば、正式に公開されます。この段階で全ユーザーが見られるようになるので、公開する前に確認をしっかりと行っておきましょう。なお、後から非公開にすることも可能です。

AWS Data Exchangeの料金


AWS Data Exchangeの料金は、使い方によって異なります。

サブスクライバーとして使用した場合は、データセットの料金をそのまま支払います。Data Exchange自体の料金は発生しません。

プロバイダーとして使用した場合は、データセットを保存するストレージの料金が発生します。東京リージョンであれば、1GBにつき0.025USDが月ごとに課金されます。

出典:「AWS Data Exchange の料金」|AWS公式サイト
参照:https://aws.amazon.com/jp/data-exchange/pricing/

AWS Data Exchangeでデータをやり取りしよう


この記事では、AWS Data Exchangeについてご紹介しました。

他機関からデータを取得して分析やモデル構築に用いたり、手持ちのデータを公開してユーザーと共有したりと、さまざまな形でデータを活用できます。

多数のデータを集めたい、またはデータの配信を簡易化したいという方におすすめです。

ITエンジニアへのキャリアチェンジならキャリアチェンジアカデミー

この記事の監修者・著者

株式会社オープンアップITエンジニア
株式会社オープンアップITエンジニア
未経験からITエンジニアへのキャリアチェンジを支援するサイト「キャリアチェンジアカデミー」を運営。これまで4500人以上のITエンジニアを未経験から育成・排出してきました。
・AWS、salesforce、LPICの合計認定資格取得件数:2100以上(2023年6月時点)
・AWS Japan Certification Award 2020 ライジングスター of the Year 受賞

おすすめの動画

  • 【未経験からIT業界へ転職するなら】相談窓口とスキルの獲得はここで解決!IT転職が一気に有利に!【キャリアチェンジアカデミー】

  • 【費用一切不要】未経験からIT業界へ転職するならまずはここへ相談!【キャリアチェンジアカデミー】

  • 【何のエンジニアになれるのか?】未経験からITエンジニアを目指すとこんな道がある【キャリアチェンジアカデミー】