007: 音声合成の正しい使い方 イントネーションって複雑

音声合成の正しい使い方 イントネーションって複雑

焼きそば問題

音声合成業界では、割と知られた日本語の法則です。

まずは、

  • 焼きそば

と発音してみてください。標準的なイントネーション(テレビのニュース的発音)だと、や、き↑そ↑ば↑、と「きそば」の音が高くなると思います。

次に、頭に装飾の単語をくっつけてみます。

  • ソース焼きそば

これだと、や↑き↓そ↓ば↓と、「や」が高くなり、他が低くなると思います。

それでは、後ろに単語をくっつけるとどうなるでしょう。

  • ソース焼きそば協会

こちらでは、や↑き↑そ↑ば↑、と上にフラットに貼りついて、協会↓、と、会の字のところで落ちます。

焼きそば、というテキストデータは同じなのに・・・

これが、日本語の発音ルールなのです。

音声合成は、もらったテキストデータを日本語のルールとしてどうなっているか?という形態素解析を行います。

こちらの記事でも処理の接続を説明しています。005: 音声合成の正しい使い方 親和性の高い技術・音声認識

つまり、4文字の単語は、だいたい前後に何かつくとこうなるぞ、というルールがあるので、同一テキストが配置場所によって、異なるイントネーションで処理されるのです。本当かな。

ふうせん、でやってみます。

  • ゴムふうせん

ほうほう。焼きそばと同じ動きです。それでは、後ろにも付けてみます。

  • ゴムふうせん事件

どんな事件だったのでしょう。発音はやきそばの時と同じ!

大した事件じゃなくて良かったです。

ルールからはずれることももちろんあります

もちろん、最近の言葉、しゃべり方、などで、期待していたイントネーションにならないときもあります。でも、ほとんどの技術は、簡単なエディターで割と簡便に修正もできます。

実際に下にある、ツイッターで投稿した音声も、修正を加えている部分もあります。

それでは、音も聴いてみてください。

一つ前の投稿では、イントネーションを間違えるみたいな屈辱的な表現をしまし たが、正しく言えば、「一般的なイントネーションルール」をしっかり作ってい る、ということです。一般的じゃないほうが悪いんです。
合成って、結構、難しいこともやってます。ツイッターのテキストを見ながら聴 いてください。まずは、単発で、「焼きそば」。きー、の音にアクセントがあり ます。続いて、皆さんも好きな、「ソース焼きそば」。今度は、やー、にアクセ ントが付いているのが分かりますでしょうか。並べてみましょう。焼きそば、 ソース焼きそば。ね?違うでしょ?さらにさらに。もう一つ単語を付けてみま しょう。そんな組織がありそうですが、ソース焼きそば協会、ほら、今度はフ ラットになりました。またまた並べますよ。こっちはコピペなんですぐできま す。焼きそば。ソース焼きそば。ソース焼きそば協会。あー、焼きそば食べたい。

安いな。


これも。こっち派ですか?


これも安い。カロリー高いぞ!


最新情報をチェックしよう!