2021/03/25

AWS Transcribeとは?使用方法や注意点について徹底解説

 
  

AWSとは

AWSというのは、Amazonから提供されている100種類以上のクラウドコンピューティングサービスのことを指します。正式名称を、Amazon Web Servicesといいます。 クラウドコンピューティングというのは、インターネットを通じて、ストレージ・サーバー・データベース・ソフトウェアなどのコンピューターを使ったサービスを使うことです。 クラウドコンピューティングならば、1台のパソコンとインターネット環境があれば、サーバーやストレージ、データベースを必要なだけ使用出来るのです。

AWS Transcribe

AWSのサービスには、文字起こしを自動で行ってくれるAmazon Transcribeという物があります。 2019年の11月頃から日本語へと対応し始めたため、このサービスを使う人が増え出しました。この記事では、AWS Transcribeの使用方法、どれだけの精度で日本語に対応しているのか、リアルタイムで文字起こしする必要のある議事録で使用出来るのか、解説していきます。

AWS Transcribeとは

AWS Transcribeというのは、Amazonから提供されるAWSサービスの1つで、文字起こしを自動でしてくれるサービスとなっています。 自動で音声を認識する機能があり、動画ファイルや音声ファイルの文字起こしや、講演会などにおけるリアルタイムの文字起こしが可能です。 IBMやGCPやなどでは既に同じような文字起こしのサービスは存在していましたが、AWSでは最近になってようやく日本語対応版がリリースされたという形です。 AWS Transcribeの英語版は精度が非常に高いため、日本語版の制度にも高い期待がされています。そしてAWSサービスなので、その他のAWSのサービスと併用しながら使用出来るという点も、AWS Transcribeに期待が持てる大きな要因と言えます。

AWS Transcribeの使用方法

AWS Transcribeの使用方法について説明します。AWS Transcribeを使用する手順は単純です。 まずAWSへとログインします。次に、S3にてバケットの作成をします。そして、ファイルをバケットにアップロードします。最後に、AWS TranscribeにてJOBの作成をします。これにて文字起こしは完了です。 使用方法の説明は以上となります。ただし、S3にてバケットの作成をする際に「東京リージョン」の場合は対象外となりますので、リージョンは米国にします。

起こした文字をドキュメントやメモ帳で表示させる方法

ここからは、AWS Transcribeで起こした文字を、ドキュメントやメモ帳で表示させる方法を説明します。 AWS Transcribeによって作成されたファイルはJSONファイルです。まずは、文字起こしの終了したJSONファイルのダウンロードを行って下さい。 次にそのJSONファイルの変換をします。ファイルを変換する方法は、オンラインの無料サービスでも、普段から使用している変換サービスでも構いません。 ここではJSONファイルからCSVファイルへと変換します。CSVファイルへの変換が終わったらダウンロードをして下さい。 次にGoogleのスプレッドシートを開いて下さい。Googleのスプレッドシートが開いたら、「ファイル」「インポート」「アップロード」の順で進み、先ほどダウンロードしたCSVファイルの選択をしてアップロードをします。 アップロードが終わると「ファイルをインポート」という画面が表示されます。ここはデフォルトのままで問題ありません。「データをインポート」をクリックします。 すると、A2のセルへと起こされた文字のインポートがされていることが分かります。後はこの文字をコピーして、ドキュメントやメモ帳へと貼り付けて加筆修正をしていくだけです。 やってみれば簡単な作業なので、JSONファイルの使い方に困っている方は是非とも試してみて下さい。

AWS Transcribe Medicalとは

AWS Transcribe Medicalというのは、医学的な専門分野へと特化したAWSサービスを指します。 具体的には、内科、小児科、産婦人科、耳鼻咽喉科などの専門的な言葉を含む音声を文字起こしすることに適したサービスです。 医師の行う診断書作成などの事務作業をサポートするスタッフである、クラークを育成するには数か月かかります。 しかしAWS Transcribe Medicalの導入をすることで、クラークの育成にかかる時間とコストが削減出来るため、クラークの人件費を節約することが出来ます。 また、医師の口から発言された内容を文字起こしするため、書き間違いや聞き間違いによるミスを無くすことが可能となります。

AWS Transcribeの注意点

AWS Transcribeを使用する上で、覚えておきたい注意点が3つあります。 日本語版の精度について、リアルタイムの文字起こしについて、日本語に未対応の機能についてです。 サービスを使いこなすためには、正しい知識を身につけて理解を深めることが大切です。それでは1つ1つ説明していきます。

日本語版の精度

AWS Transcribeの英語版は精度が高く、優秀な文字起こしサービスであると高い評価を受けています。 しかし、日本語版の精度は、正直に言うと完璧ではありません。ただし個人によって感覚の違いは大きいので、この精度に不満を持つ人もいれば持たない人もいます。 また、環境にも左右される所があり、録音に使用したマイクや、雑音の有無などによっても精度は変わります。

リアルタイムの文字起こし

AWS Transcribeは、録音済みである動画ファイルや音声ファイルを文字起こしするのに便利ですが、リアルタイムの会議なども字幕表示が可能です。 複数人の語り手がいる場合、話し手の人数を事前に登録しておくことで、誰がいま話しているのかを認識して文字を表示してくれます。 ある程度の内容が分かれば問題無いという場合なら、このリアルタイム文字起こしでも対応が出来ます。 しかし議事録などの大切な場面で使用する場合は、一度録音して音声ファイルを作った上で文字起こしをした方が無難と言えます。 他に注意しなければいけないのは、話し手が「えーと」「あのう」などの文字に起こす必要のない言葉を発した場合も文字に起こされてしまうことです。勿論これはリアルタイムでの文字起こし限定の話ではありません。

日本語に未対応の機能

ここまで、リアルタイムの文字起こしが出来るというお話をしてきました。しかし、AWS Transcribe及びAWS Transcribe Medicalによるリアルタイムの文字起こしは、日本語に対応をしていません。 日本語に対応しているのは、動画ファイルや音声ファイルの文字起こしする機能のみです。そのため現段階では、会議やインタビューの議事録を作るには、撮影や録音をしたファイルを後から文字起こしするという形となります。

AWS Transcribeの料金

AWS Transcribe 及び AWS Transcribe Medical の料金は従量課金制で、1か月の間に文字起こしをした音声の時間に基づき算出されます。 ちなみに無料利用枠という物があり、サインアップをしてから12か月間、1か月に60分まで無料で使用出来ます。

まとめ

AWS Transcribeの日本語版には今後に期待といった所でしょう。しかし現段階でも既に動画や音声の文字起こしをする上で、かなり便利な機能と言えます。 英語版なら、セミナーや講演会などで、モニターに文字をリアルタイムで映すことも出来ます。また、導入してしまえばコスト削減も可能です。 AWS Transcribeには無料利用枠もあるので、試しに利用してみることをおすすめします。]]>

ITエンジニアへのキャリアチェンジならキャリアチェンジアカデミー

この記事の監修者・著者

株式会社オープンアップITエンジニア
株式会社オープンアップITエンジニア
未経験からITエンジニアへのキャリアチェンジを支援するサイト「キャリアチェンジアカデミー」を運営。これまで4500人以上のITエンジニアを未経験から育成・排出してきました。
・AWS、salesforce、LPICの合計認定資格取得件数:2100以上(2023年6月時点)
・AWS Japan Certification Award 2020 ライジングスター of the Year 受賞

おすすめの動画

  • 【未経験からIT業界へ転職するなら】相談窓口とスキルの獲得はここで解決!IT転職が一気に有利に!【キャリアチェンジアカデミー】

  • 【費用一切不要】未経験からIT業界へ転職するならまずはここへ相談!【キャリアチェンジアカデミー】

  • 【何のエンジニアになれるのか?】未経験からITエンジニアを目指すとこんな道がある【キャリアチェンジアカデミー】