レビュー
“文字起こし”の手間と時間を削減!

録音ファイルを自動でテキスト化できるボイスレコーダー「AutoMemo(オートメモ)」の使える度は?

取材や会議、打ち合わせが終わってひと息ついたのも束の間、すぐに取りかからなければならない面倒な作業と言えば、ボイスレコーダーで録音した音声の文字起こしである。起こしたテキストをもとに、会議メモや議事録、取材記事などを作成するわけだが、これがなかなかおっくうで、ていねいに起こそうとすると、録音時間の2〜3倍、1時間の音声なら2〜3時間を費やすことも珍しくない。そこで目を付けたのが、ソースネクストのボイスレコーダー「AutoMemo(オートメモ)」。録音した音声ファイルを自動でテキスト化できる、「あったらいいな」を形にした新アイテムだ。

音声を録音するだけで、自動的にテキスト化

「AutoMemo」の機能はごくシンプルで、録音した音声ファイルがWi-Fi経由でクラウドにアップ、保存され、自動でテキスト化されるというもの。録音ファイルとテキストはスマートフォンアプリで確認できるほか、あらかじめ設定しておけば、メールでも受け取れる。いちいちスマートフォンからパソコンにデータを転送する必要がなく、メールを開くだけでテキストと音声を確認できるのはありがたい。

AI通訳機「POCKETALK(ポケトーク)」で大ヒットを飛ばしたソースネクストが送り出す、AIによる音声認識を生かしたボイスレコーダー「AutoMemo」。録音した音声ファイルを自動でテキスト化してくれるので、文字起こしの手間を省き、会議メモや議事録、取材記事などを効率よく作成できるという

AI通訳機「POCKETALK(ポケトーク)」で大ヒットを飛ばしたソースネクストが送り出す、AIによる音声認識を生かしたボイスレコーダー「AutoMemo」。録音した音声ファイルを自動でテキスト化してくれるので、文字起こしの手間を省き、会議メモや議事録、取材記事などを効率よく作成できるという

本体サイズは一般的なボイスレコーダーよりもやや大きめだが、スマートフォンよりはずっとコンパクトで、手のひらに収まるサイズ感。厚さも12mmとスリムなので、ジャケットの胸ポケットに入れて持ち運ぶのも無理がない。操作インターフェイスは、本体前面に大小の操作ボタンが2つ、側面に電源ボタンがひとつとシンプル。

本体前面の2つのボタンは、大きいほうが録音開始/停止ボタンで、小さいほうがブックマークボタン。録音中にブックマークボタンを押すと、録音ファイルがテキスト化される際、その部分にチェックがつき、あとから検索しやすくなる。

本体サイズは約41(幅)×130(奥行)×12(高さ)mm、重量は約86g。左隣に並べたのは5.6インチの「Google Pixel 3a」で、「AutoMemo」が一般的なスマートフォンよりも小さい、手のひらに収まるサイズ感なのがわかる

本体サイズは約41(幅)×130(奥行)×12(高さ)mm、重量は約86g。左隣に並べたのは5.6インチの「Google Pixel 3a」で、「AutoMemo」が一般的なスマートフォンよりも小さい、手のひらに収まるサイズ感なのがわかる

本機にはディスプレイはなく、各種設定はすべてスマートフォン経由で行う。録音した音声の再生も「AutoMemo」単体では行えない。いったん録音ファイルをWi-Fi経由でクラウドにアップしてから、それをスマートフォンで参照する仕組みだが、常時スマートフォンと併用しなければいけないわけではなく、録音時には「AutoMemo」単体で動作する。一般的なボイスレコーダーが録音と再生を1台で完結できるのに対して、「AutoMemo」本体が行うのは録音まで。本体自体はあくまでも録音専用機というわけだ。

本体前面に録音ボタンとブックマークボタン、側面に電源ボタンを装備。ボイスレコーダーによくあるディスプレイは非搭載だ

本体前面に録音ボタンとブックマークボタン、側面に電源ボタンを装備。ボイスレコーダーによくあるディスプレイは非搭載だ

充電は本体底面のUSB Type-Cポートから行う。バッテリー容量は1,400mAhで、連続録音時間は約5.5時、充電時間は約2.5時間。USB Type-Cポートの隣には、外付けマイク用の3極ステレオマイク端子を備える

充電は本体底面のUSB Type-Cポートから行う。バッテリー容量は1,400mAhで、連続録音時間は約5.5時、充電時間は約2.5時間。USB Type-Cポートの隣には、外付けマイク用の3極ステレオマイク端子を備える

録音ファイルの再生や、起こしたテキストの確認、各種設定はすべてアプリ上で行う

録音ファイルの再生や、起こしたテキストの確認、各種設定はすべてアプリ上で行う

あらかじめ設定しておけば、録音ファイルとテキストをメールでも受け取れる

あらかじめ設定しておけば、録音ファイルとテキストをメールでも受け取れる

なお、録音ファイルをテキスト化するサービスだが、購入時に設定されている無料で使えるベーシックプランをはじめ、以下の3つのプランが用意されている。これらのプランは利用頻度に合わせて選ぶといいだろう。

本体購入時は無料のベーシックプランとなっており、プラン変更の手続きはアプリから行う

本体購入時は無料のベーシックプランとなっており、プラン変更の手続きはアプリから行う

使って検証! 気になるテキスト変換の精度は?

さてさて、気になる文字起こしの精度はどうだろう? まずは、過去に行われた会議の議事録を読み上げてみることにしたが、今回の検証では、あえてマスクを着けたまま行うことにした。「AutoMemo」にとっては酷かもしれないが、そのほうが実際の録音状況に即しているからだ。

結果は以下の通り。テキストには句読点が付かず、ところどころ間違いもあるが、内容を理解するには十分なレベルと言えるのではないだろうか。

少なからず間違いはあるものの、実用には十分な精度。段落ごとに付けたブックマークで適宜改行されているため、スムーズに読むことができる

少なからず間違いはあるものの、実用には十分な精度。段落ごとに付けたブックマークで適宜改行されているため、スムーズに読むことができる

専門的な単語も出てくる議事録、しかもマスクを着けたままという条件下でこの精度は立派。オンライン会議でもこの調子で高精度にテキスト化してくれることを期待したが、Zoomでの打ち合わせを録音してみたところ、残念ながら、変換精度がかんばしくない。「AutoMemo」本体のすぐ近くにいる筆者の発言は比較的正しく変換されているが、打ち合わせ相手、つまりノートPCのスピーカーから聞こえる音声に関しては精度がガクッと落ちている。

・正:まだ保留中ですか? 誤:まだ保留手数ですが、・正:出すかもしれないみたいな 誤:出すかもしれんな Vita・正:マイナビの方が 誤:真由美の方がといった具合に、オンライン会議では変換精度が著しく落ちてしまった

・正:まだ保留中ですか? 誤:まだ保留手数ですが、・正:出すかもしれないみたいな 誤:出すかもしれんな Vita・正:マイナビの方が 誤:真由美の方がといった具合に、オンライン会議では変換精度が著しく落ちてしまった

この結果から、「オンラインよりもオフラインのほうが相性がいい」と推察できるが、先ほどの「議事録の読み上げ」をノートPCのスピーカーから出力し、それを「AutoMemo」で録音してみたところ、文字認識の精度は「オンライン会議」よりも高かった。どうやら「AutoMemo」は、オンラインよりもオフライン、口語よりも文語を得意としているようである。

「AutoMemo」はオンラインよりもオフライン、口語よりも文語との相性がいいようだ

「AutoMemo」はオンラインよりもオフライン、口語よりも文語との相性がいいようだ

とはいえ、オンライン会議ではまったく使い物にならないかと言えば、そんなことはない。数字などのキーワードや技術用語、企業名などは比較的正確に拾えていたので、あとから確認のために必要な音声データを呼び出したい時には重宝するし、あくまでも「メモ」として使う前提なら、会議や打ち合わせのおおまかな流れは追うことができる。使いどころは選ぶものの、その性能を生かせる場面は多くありそうだ。

使い勝手の面では、「AutoMemo」を接続するWi-Fiネットワークを、スマートフォンのテザリングに設定しておくのが便利だと感じた。テザリングなら、出先での録音後、すぐに音声や文字の確認ができるからだ。ディスプレイも音声出力もない「AutoMemo」の場合、その場ですぐに録音データを確認できないところがウィークポイントとなるが、テザリングを活用すれば問題なし。「AutoMemo」を上手に活用するためのコツとして、頭に入れておいてほしい。

毛利真大

毛利真大

編プロでの広告制作、雑誌編集を経てフリーライター/エディターに。家電をはじめ、自動車、ファッション、ビジネス関連など幅広い分野で活動。86年、秋田県出身。「大曲の花火」とグミをこよなく愛する。

記事で紹介した製品・サービスなどの詳細をチェック
関連記事
価格.comマガジン プレゼントマンデー
ページトップへ戻る