010: 音声合成の正しい使い方 感情表現をネロとパトラッシュで

音声合成の正しい使い方 感情表現をネロとパトラッシュで

音声合成は「人工標準語」

音声合成の特徴の一つ、のうち、良くも悪くも最大の特徴かもしれません。

それは、感情をこめてしゃべる、というのが苦手なこと。

音声合成は、コード化されたルールをCPUが順番に処理して音にします。この、ルール、というのがポイントの一つ。

音声合成も使われなければ開発もされませんから、一番多く使う「情報伝達」を中心に考えます。同じ目的を持っている音声は既にあります。それは、ニュースのアナウンス。

ニュースはいわゆる「標準語」。

ところで、この標準語ですが、東京周辺の言葉、ということではありません。男はつらいよ、をご覧いただければ、東京の人だって標準語なんてしゃべってないです。あくまでも、情報伝達のために、なるべく曖昧な言葉を無くした人工言語、って思ってます。諸説あります。

音声合成も、この、標準語。

人工標準語+ニュートラルな発音≠感情

なので、普通に悲しい話も、淡々としゃべることになります。今回の上の説明も、だいぶ織り込まれているツイッター投稿をお聴きください。

音声合成の特徴の一つ、のうち、良くも悪くも最大の特徴かもしれません。それは、感情をこめてしゃべる、というのが苦手なこと。音声合成は、コード化されたルールをCPUが順番に処理して音にします。この、ルール、というのがポイントの一つ。音声合成も使われなければ開発もされませんから、一番多く使う「情報伝達」を中心に考えます。同じ目的を持っている音声は既にあります。それは、ニュースのアナウンス。ニュースはいわゆる「標準語」。東京周辺の言葉、ということではありません。男はつらいよ、をご覧いただければ、東京の人だって、標準語なんてしゃべってないです。あくまでも、情報伝達のために、なるべく曖昧な言葉を無くした人工言語、って思ってます。諸説あります。音声合成も、この、標準語。なので、普通に悲しい話も、淡々としゃべることになります。やってみましょう。少年が寒い冬の教会に忍び込み、念願の名画を鑑賞しましたが、寒さで力尽き、愛犬と共に天使によって天に召される、だめです、涙も出てきません。

感情を用いずに使う

ここでの結論の一つが、感情は人間に叶わないので、戦わない、という道もあるという事です。あくまでも情報のみに使って、感情は受け取った側が感じる。或いは、感情を伝える必要が無い場面で堂々と活用する。とはいえ、感情表現はまったくできないわけではありません。

いくつかの方法はあるがコスト次第

調整

調整により、頑張ってイントネーションも含めて頑張るやり方もあります。でも、笑いながら怒るイントネーション、というのがすぐに思い当たりますでしょうか?それより自分でしゃべった方が速い。

収録

或いは、元データとなる原稿を読んでもらう時に、それこそ「面倒くさそうに読む」「悲しみをこらえて読む」をずーっと保って発音してもらえれば、ニュアンスが残った状態でデータを作ることもできます。

しかし、いずれもコストや時間がかかるやり方。もう少し先の技術を待つか、人間がやるか、かなぁ、と思ってます。

しかし。活字を読んで人間は泣ける感受性があります。淡々とした情報提供で、中身で感情を伝える考え方はまだあると思ってます。

 

 

最新情報をチェックしよう!