あなたの「コエ」がしゃべり出す!自分の声を自動音声に変換するアプリが登場

「コエ」の明るさや感情はすべてパラメータで調整可能

  • 指定の文章を読み上げることであなたの「コエ」を育てる
  • 想定以上の反響でサーバーがパンクしそうなほど
  • スタッフも自分の「コエ」をつくってみた

東芝デジタルソリューションズ株式会社は4月17日、人間の声を人工的に作れる音声合成技術を使い、自分の声で入力したテキストをしゃべらせることができるスマートフォンアプリ「コエステーション」(iOS)の提供を開始した。

「コエ」を成長させるほど似てくる!?

「コエステーション」アプリを開き、アカウントを作成しログインした後、指定された文章を読み上げることで、あなたの声を録音し、その特徴を学習して分身となる「コエ」を生成する。

指定の文章を読めば読むほど、あなたにより近い「コエ」を育てることが可能で、そのレベルは5段階まで進化する。(コエレベル1…10文)(コエレベル3…100文)(コエレベル5…200文)

「コエ」が完成したら、テキストに文章を入力することで、読み上げてくれる。年齢や明るさ、それに喜び・怒り・悲しみなどの感情をパラメータ調整で自由に変更することも可能で、育てた「コエ」をSNS(LINE・Facebook・Twitter)等でシェアしたり、アプリ内のコンテンツで利用することもできる。

そして、恋人や孫とシェアした「コエ」を音声合成するサービスも展開しており、カーナビの音声を「恋人のコエ」や「孫のコエ」で読み上げてもらうといったことも可能とのこと。

スタッフもやってみた

早速「コエステーション」をインストールして、アカウントを作成しログインすると、下写真左のような画面が出てきた。

ページ下部に、【読み上げボタン】と【育てるボタン】が表示されている。
まずはレベル1の「コエ」を生成する必要があるため、【育てるボタン】を押すと、周囲の環境音をお確かめくださいというアナウンスと共に、音量メーターが表示された。「収録時はイヤフォンマイクを推奨しています」とのこと。

指定された例文をすべて読み上げ、画面右上の【コエをつくる】を押すと下写真右のような画面になった。生成が終わると、アカウントを作成する際に指定したメールアドレスに通知が来るそうだ。

15分ほどで「コエ」の生成が終わったとのメールが届いた。
録音時にオンにしていたマイク機能を設定でオフに切り替えなければ、何も聞こえてこないので注意。

適当にテキストを入力して、読ませてみたが、やはりレベル1の状態だとただの自動音声と何ら変わりがないように思えた。その後、レベル5まで育ててみたが、滑舌と発音の悪さが災いしてか、スタッフの声ではイマイチだったので、問い合わせてみたところ、いくつかコツを教えてくれたので、参考にして頂きたい。

高品質の「コエ」を作るには、
・出来るだけ静かな環境でノイズが入らないようにする
・最初から最後まで出来るだけ一定の調子で読み上げる
・出来るだけ多くの文を読む
・イヤフォンマイクを使って、口とマイクの距離は一定に保つ


上記4点に留意し、読み上げるスピードや調子、声量などがマチマチだと、声の学習に悪影響があり、不安定な「コエ」になってしまい、機械っぽい喋り方になってしまうとのこと。うまくいかない場合は、育てた「コエ」をリセットし、再度注意して育ててみると、きっと今よりも高品質な「コエ」が作れるはずだ。

今後はタレントや声優の「コエ」も視野に展開予定

「コエステーション」の担当で、RECAIUS事業推進部 コエステーション事業プロジェクトリーダーの金子祐紀さんにお話を聞いた。

ーーなぜこのアプリを開発しようと?

東芝では研究所で40年以上前から音声合成の研究をしていました。カーナビとかでも当社の音声合成は活用してもらっていまして、 この東芝の音声合成の技術を、もっと世の中の人に使ってもらいたい、という想いがありました。

また、写真とかテキストと違って、声って自由に使えてないという気づきもありました。(スマホアプリで写真をデコったり)

そこで、みんなの声が集まったプラットフォームが作れたら、みんなにとってハッピーとひらめき、全自動でコエの生成ができる技術が確立できたので、「スマホのアプリで誰でも自由に自分の声によく似た音声合成を自由に使えるアプリを提供したい」「色々楽しんでもらいたい」と思った次第です。

また、病気や怪我などで、自分の声でしゃべることができない方が国内だけでも50万人以上いらっしゃるので、その方々にも活用いただければと思っています。

ーーユーザーからの反響は?

おかげさまで、想定以上にユーザーの皆さんが集まり、サーバーがパンクしそうなほど、大きな反響となっています。Appストアのエンタメカテゴリで現在32位です(4/19 18:40現在)。
また、一般ユーザーだけでなく、ビジネスユーザーからもコエステを活用したいという声をいただいています。


ーー自分の「コエ」を使った“なりすまし詐欺”など、アプリを悪用される恐れは?

「コエ」を作成するには、アプリの画面に表示される原稿を読み上げる必要があるため、日常会話等の録音データから第三者が「コエ」を作成することはできません。「コエ」はメールアドレスとパスワードで認証した、利用者のアカウントで利用しますので、第三者に勝手に使われないよう、パスワード等の管理をしっかり行っていただくよう、ユーザーの方々にお願いしております。

また、「コエ」で音声データを作成するためには話させたい言葉・文章を一旦テキストとして文字入力する必要があることから、電話の応対のようなスムーズな会話には不向きであり、「オレオレ詐欺」のような犯罪に悪用することは困難と考えられます。なお、本サービスでは、第三者のアカウントであなたの「コエ」を用いて言葉・文章を読み上げさせることができる仕組みにはなっていません。

ーー今後「コエステーション」を活用したサービス予定は?

弊社で面白いサービス・アプリもつくっていきたいですが、「コエステーション」はプラットフォームなので、一般人から有名人まで集めた様々な「コエ」を色々なサービス企業さまに、提供・共創し、「コエ」のサービスが盛り上がるのを期待しています。 

今後は、多様な業種・業態の皆さまとの共創をすすめ、自分の「コエ」に加え、タレントや声優などの「コエ」をあらゆる場面でセキュア(安全)かつ自由に使える新しい音声文化の醸成を目指していきたいと思っております。

「コエ」を使ったコミュニケーションがどのように発展していくのか注目だが、今後「コエ」と「声」の区別がつかなくなる未来も遠くないのかも知れない。


なんでもAIの他の記事