swelog ニュースで語るスウェーデン

スウェーデンの気になるニュースを毎日伝えるブログです

声の選べるオーディオブック・声クローンのAI技術はここまで進んだ

AIを使って古いデモ録音からジョン・レノンの声を取り込み完成させた曲をビートルズとして今年中に発表するとポール・マッカートニーがラジオで話したそうだが、今朝はもうひとつ、AIを使ってオーディオブックの朗読の声を自分で選べるようになるという話がニュースになっていた。今のAI技術で、声はとてもはやく簡単にクローンを作成できるものになった。

swelog.theletter.jp

既にアップルやグーグルはAIが読み上げるオーディオブックを発表したそうだが、スウェーデンのオーディオブック最大手のStorytelもAIを使って、リスナーが読み上げる声を選べる機能を提供する。

アストリッド・リンドグレンなど、著名作家自身の声で読み上げるものを聞きたいという要望は根強く、Storytelは今一緒に仕事をしている朗読者たちとも話を始めている。反応は様々だそうだが、人気の声はますます使われるようになって、ごく少数の声の寡占状況となる可能性もあるが、人々がAIではなく人間の声を望めば、これからも人間の声は残っていくとStorytelは説明する。

現時点では、英語の声クローン技術は恐ろしいほど高度に開発されている。SVTの記者が、短い文章を読み上げて録音したものを学習させて、まったく新しい別の文章を声クローンに読み上げさせていたが、声は自然でよくできており、本人にはないちょっとアメリカンなアクセントが聞き取れたくらい。

Storytelはこのまま開発を進めれば、今年のクリスマス頃にはスウェーデン語でも同レベルに達することができるだろうと話す。ただしAIが作ることは完璧すぎて、本当の人間は完璧ではないので、そのようなツルッとした声を人々が好むかどうかは未知数だと、取材された文芸評論家は答えていた。

そっか。私はスウェーデンで日本の人と会う時は、標準語で話すことが多いのだけれど、これからはどこでも関西弁で話すようにすれば、私の声は少しは盗まれにくくなりそう。スウェーデン語や英語の発音は、もとから壊れてるし、AI時代にユニーク性を発揮しやすい、よい特質が私の発話にはあるということで、安心だよ!😉

SVTの記者が自分を声をAIでクローン化される様子(SVT)

© Hiromi Blomberg 2023