この記事の目次
AWSとは
![](https://b-engineer-media-cms.s3.amazonaws.com/item/image/user/9e08934fd24485c7d9e691a312f16a4ef7ff96eb/35243f00-6773-4465-8ac2-7ac2bb3bf90c.jpg)
AWS Transcribe
![](https://b-engineer-media-cms.s3.amazonaws.com/item/image/user/356a192b7913b04c54574d18c28d46e6395428ab/7e58a2de-f3e8-4962-96d8-0f498667fd8e.jpg)
AWS Transcribeとは
AWS Transcribeというのは、Amazonから提供されるAWSサービスの1つで、文字起こしを自動でしてくれるサービスとなっています。 自動で音声を認識する機能があり、動画ファイルや音声ファイルの文字起こしや、講演会などにおけるリアルタイムの文字起こしが可能です。 IBMやGCPやなどでは既に同じような文字起こしのサービスは存在していましたが、AWSでは最近になってようやく日本語対応版がリリースされたという形です。 AWS Transcribeの英語版は精度が非常に高いため、日本語版の制度にも高い期待がされています。そしてAWSサービスなので、その他のAWSのサービスと併用しながら使用出来るという点も、AWS Transcribeに期待が持てる大きな要因と言えます。AWS Transcribeの使用方法
![](https://b-engineer-media-cms.s3.amazonaws.com/item/image/user/5e9e289364bb3ddfa01b2e7a2998e19f5b1eaf36/065316f3-57ed-4e3d-9ee4-7d5f7ba7eedf.jpg)
起こした文字をドキュメントやメモ帳で表示させる方法
ここからは、AWS Transcribeで起こした文字を、ドキュメントやメモ帳で表示させる方法を説明します。 AWS Transcribeによって作成されたファイルはJSONファイルです。まずは、文字起こしの終了したJSONファイルのダウンロードを行って下さい。 次にそのJSONファイルの変換をします。ファイルを変換する方法は、オンラインの無料サービスでも、普段から使用している変換サービスでも構いません。 ここではJSONファイルからCSVファイルへと変換します。CSVファイルへの変換が終わったらダウンロードをして下さい。 次にGoogleのスプレッドシートを開いて下さい。Googleのスプレッドシートが開いたら、「ファイル」「インポート」「アップロード」の順で進み、先ほどダウンロードしたCSVファイルの選択をしてアップロードをします。 アップロードが終わると「ファイルをインポート」という画面が表示されます。ここはデフォルトのままで問題ありません。「データをインポート」をクリックします。 すると、A2のセルへと起こされた文字のインポートがされていることが分かります。後はこの文字をコピーして、ドキュメントやメモ帳へと貼り付けて加筆修正をしていくだけです。 やってみれば簡単な作業なので、JSONファイルの使い方に困っている方は是非とも試してみて下さい。AWS Transcribe Medicalとは
![](https://b-engineer-media-cms.s3.amazonaws.com/item/image/user/9e08934fd24485c7d9e691a312f16a4ef7ff96eb/654bd373-e8cd-4bfa-b2e9-6a2405b5a5ff.jpg)
AWS Transcribeの注意点
![](https://b-engineer-media-cms.s3.amazonaws.com/item/image/user/356a192b7913b04c54574d18c28d46e6395428ab/272a2336-5b05-41db-9794-42346b1c6582.jpg)
日本語版の精度
AWS Transcribeの英語版は精度が高く、優秀な文字起こしサービスであると高い評価を受けています。 しかし、日本語版の精度は、正直に言うと完璧ではありません。ただし個人によって感覚の違いは大きいので、この精度に不満を持つ人もいれば持たない人もいます。 また、環境にも左右される所があり、録音に使用したマイクや、雑音の有無などによっても精度は変わります。リアルタイムの文字起こし
AWS Transcribeは、録音済みである動画ファイルや音声ファイルを文字起こしするのに便利ですが、リアルタイムの会議なども字幕表示が可能です。 複数人の語り手がいる場合、話し手の人数を事前に登録しておくことで、誰がいま話しているのかを認識して文字を表示してくれます。 ある程度の内容が分かれば問題無いという場合なら、このリアルタイム文字起こしでも対応が出来ます。 しかし議事録などの大切な場面で使用する場合は、一度録音して音声ファイルを作った上で文字起こしをした方が無難と言えます。 他に注意しなければいけないのは、話し手が「えーと」「あのう」などの文字に起こす必要のない言葉を発した場合も文字に起こされてしまうことです。勿論これはリアルタイムでの文字起こし限定の話ではありません。日本語に未対応の機能
ここまで、リアルタイムの文字起こしが出来るというお話をしてきました。しかし、AWS Transcribe及びAWS Transcribe Medicalによるリアルタイムの文字起こしは、日本語に対応をしていません。 日本語に対応しているのは、動画ファイルや音声ファイルの文字起こしする機能のみです。そのため現段階では、会議やインタビューの議事録を作るには、撮影や録音をしたファイルを後から文字起こしするという形となります。AWS Transcribeの料金
![](https://b-engineer-media-cms.s3.amazonaws.com/item/image/user/9e08934fd24485c7d9e691a312f16a4ef7ff96eb/19327c42-a414-4878-92a6-23d69115bc2b.jpg)
まとめ
![](https://b-engineer-media-cms.s3.amazonaws.com/item/image/user/f5ef944a50653ad198392450d8cdba1dea4885cc/87a2e1f3-0fdc-4110-8476-dbf1920c6d4e.png)
この記事の監修者・著者
![株式会社オープンアップITエンジニア](https://tenshoku-careerchange.jp/wp-content/uploads/2023/07/fzxADbr-_400x400-1-150x150.jpg)
-
未経験からITエンジニアへのキャリアチェンジを支援するサイト「キャリアチェンジアカデミー」を運営。これまで4500人以上のITエンジニアを未経験から育成・排出してきました。
・AWS、salesforce、LPICの合計認定資格取得件数:2100以上(2023年6月時点)
・AWS Japan Certification Award 2020 ライジングスター of the Year 受賞
最新の投稿
- 2024年3月26日キャリア・転職保安職(自衛官・警察・消防官など)に向いている人の性格・特徴ランキング【現役保安職(自衛官・警察・消防官など)36人が回答】
- 2024年3月26日キャリア・転職保安職(自衛官・警察・消防官など)に必要なスキルランキング&スキルアップの方法とは?【現役保安職(自衛官・警察・消防官など)36人が回答】
- 2024年3月26日キャリア・転職クリエイター職(ライター・デザイナー・編集)に向いている人の性格・特徴ランキング【現役クリエイター職(ライター・デザイナー・編集)64人が回答】
- 2024年3月26日キャリア・転職クリエイター職(ライター・デザイナー・編集)に必要なスキルランキング&スキルアップの方法とは?【現役クリエイター職(ライター・デザイナー・編集)64人が回答】