音声合成の正しい使い方 方言は苦手
音声合成は標準語
音声合成は、学術的にじっくり開発されました。必要だったのは、音を出す技術ももちろんですが、日本語をしっかりCPUが処理できるようにルール化する部分。
そうすると、全国の方言を全部やってる暇はない、まずは標準語、となるのは当然です。
標準語≠東京の言葉
前にも説明しましたが、標準語を日常で使う人はいません。ん?そうなの?って思った方。東京近郊の人がしゃべってる言葉が標準語、と思っていませんか?
色々な地方には色々な方言があり、東京には東京の方言があります。標準語は、それらの方言独特の言い回しを全部排除して、誰でも分かる言葉として作ったいわば人工語。例えば、鹿児島の言葉でニュースを伝えてもらっても、自分も分からないかもしれない。東京弁でニュースを読んだら、これだって頻度は少ないとは思いますが、分からない表現もあります。
標準語は、日本全国の人に正しく情報を伝えるための言葉。様々な地方から集まった人たちが、地方でしか通じない言葉で会話をしても、お互い理解できないこともあります。なので、マスコミの報道で使われている標準語を使うことが多くなるのです。
音声合成もその標準語を元に作られています。つまりつまり。音声合成は、情報を伝える用途が合っている、というのがここでも言えます。
方言のルール化がしっかりされればできる
逆にいえば、特定の方言を再現する音声合成が必要な場合、その方言のルールをしっかりと規定できれば良いのです。それには時間も金もかかるので、それでお金が稼げれば誰かがやる、そうでないからやらない、というだけです。
方言と標準語の違う部分
まずは単語
文字で書くと全く標準語の辞書には載ってないものもたくさんあります。博多に住み始めて最初に戸惑った言葉が「かたる」。語る、かと思ったら違っていて、「参加する」という意味でした。「先生もかたってください!」と言われて(当時、バイトで先生やってました)、何かを語らないといけないのか、と思ったら、こっちこっち、と。ちゃんと聞いてみたら参加して、だったわけです。
語尾
これはもう。たくさんありすぎて。そげん言われても多すぎて出しきれんたい。
これが地方ごとにあるので、もうなんといいますか、非常に面白い。でも、研究レベルでやろうとすると、それだけ大変ってことです。
イントネーション
これももうルールにできるほど整理されてないくらい、あちこちであちこちのイントネーション。
直す方法は無くはない
音声合成のシンセサイザーに与えるデータを、方言の単語、方言のイントネーション、に手で修正すれば、それっぽいことができなくはありません。でも、それならその方言を話す人にしゃべってもらった方が速い、ということでなかなか定着しにくいやり方。
時間があればやってみたいです。自分は、名古屋弁と博多弁と京都弁はできるかもしれません。外国語がたくさんできる人みたいでかっこいいぞ。
無理やり文字だけ入れたらどうなる?
やってみました。
あかんですね。これでは。
でも、面白いと思われるかもしれないので、使いどころです。コンテンツとして成立すればなんでもよろしい。
そんなわけで、次回はちょっと音声合成と相性の良い方言の話を。