音声合成の正しい使い方 イントネーションって複雑
焼きそば問題
音声合成業界では、割と知られた日本語の法則です。
まずは、
- 焼きそば
と発音してみてください。標準的なイントネーション(テレビのニュース的発音)だと、や、き↑そ↑ば↑、と「きそば」の音が高くなると思います。
次に、頭に装飾の単語をくっつけてみます。
- ソース焼きそば
これだと、や↑き↓そ↓ば↓と、「や」が高くなり、他が低くなると思います。
それでは、後ろに単語をくっつけるとどうなるでしょう。
- ソース焼きそば協会
こちらでは、や↑き↑そ↑ば↑、と上にフラットに貼りついて、協会↓、と、会の字のところで落ちます。
焼きそば、というテキストデータは同じなのに・・・
これが、日本語の発音ルールなのです。
音声合成は、もらったテキストデータを日本語のルールとしてどうなっているか?という形態素解析を行います。
こちらの記事でも処理の接続を説明しています。005: 音声合成の正しい使い方 親和性の高い技術・音声認識
つまり、4文字の単語は、だいたい前後に何かつくとこうなるぞ、というルールがあるので、同一テキストが配置場所によって、異なるイントネーションで処理されるのです。本当かな。
ふうせん、でやってみます。
- ゴムふうせん
ほうほう。焼きそばと同じ動きです。それでは、後ろにも付けてみます。
- ゴムふうせん事件
どんな事件だったのでしょう。発音はやきそばの時と同じ!
大した事件じゃなくて良かったです。
ルールからはずれることももちろんあります
もちろん、最近の言葉、しゃべり方、などで、期待していたイントネーションにならないときもあります。でも、ほとんどの技術は、簡単なエディターで割と簡便に修正もできます。
実際に下にある、ツイッターで投稿した音声も、修正を加えている部分もあります。
それでは、音も聴いてみてください。
一つ前の投稿では、イントネーションを間違えるみたいな屈辱的な表現をしまし たが、正しく言えば、「一般的なイントネーションルール」をしっかり作ってい る、ということです。一般的じゃないほうが悪いんです。
合成って、結構、難しいこともやってます。ツイッターのテキストを見ながら聴 いてください。まずは、単発で、「焼きそば」。きー、の音にアクセントがあり ます。続いて、皆さんも好きな、「ソース焼きそば」。今度は、やー、にアクセ ントが付いているのが分かりますでしょうか。並べてみましょう。焼きそば、 ソース焼きそば。ね?違うでしょ?さらにさらに。もう一つ単語を付けてみま しょう。そんな組織がありそうですが、ソース焼きそば協会、ほら、今度はフ ラットになりました。またまた並べますよ。こっちはコピペなんですぐできま す。焼きそば。ソース焼きそば。ソース焼きそば協会。あー、焼きそば食べたい。
合成って、結構、難しいこともやってます。ツイッターのテキストを見ながら聴 いてください。まずは、単発で、「焼きそば」。きー、の音にアクセントがあり ます。続いて、皆さんも好きな、「ソース焼きそば」。今度は、やー、にアクセ ントが付いているのが分かりますでしょうか。並べてみましょう。焼きそば、 ソース焼きそば。ね?違うでしょ?さらにさらに。もう一つ単語を付けてみま しょう。そんな組織がありそうですが、ソース焼きそば協会、ほら、今度はフ ラットになりました。またまた並べますよ。こっちはコピペなんですぐできま す。焼きそば。ソース焼きそば。ソース焼きそば協会。あー、焼きそば食べたい。
そうですか。それではこれ。
安いな。
リンク
これも。こっち派ですか?
リンク
これも安い。カロリー高いぞ!
リンク