音声合成の正しい使い方 「よくある表記」がよくない!
色々な場所で、「商業的によくある表記」。我々はなにげなく読んでしまいますが、音声合成にとって、記号や数字や造語など、ワナだらけです。ありそうな例にチャレンジしてみます。
いくつか例をだしてみます
- ¥1,200/個
- 合成戦隊ゴーセイジャー
- あなたの言うことは「?」ですよ
- 評価:★★☆☆☆
- 12/24開催「Grand Game チャンピオン大会」
- やまだ☆たろ、が歌います「愛・Love・U」
- は、よくある、値段の表記。実際に声に出してみてください。 /個、のところ、人間でも読む?読まない?と迷いますよね。
- はいわゆる「造語」です。これは、データベースには入ってなさそうです。どうなるか。
- はよくある表記。?の部分は目で読むとニュアンスは伝わりますが、朗読なら人間でも迷いそう。
- 5つ星のうち、いくつか、みたいな表記です。これも正確な読み方は、人間でも迷います。
- 日付の数字、英単語と日本語、さらに「」などなど。読むのはできますね。
- これはもう間違いなくつのだ☆ひろさんのことなんですが、当然、☆は発音しません。さて、どうなるか。
いずれも結構大変そうです。
読み方も規定されていない
実際に挙げてみた例ですが、実は、「正しい読み方」というのが、放送で使う用例でも規定がされていないものです。
つまり、聴く側も正解が分かってない。ということは、開発者も分かってない。でも、実際に慣例的にはそれほど少なくない状況で使われたりしています。
人間の日本語に対する「補完能力」が高いため、アバウトな状態でも、大きく意味は異ならないならば、個人差が多少あろうと、使われてしまうわけです。
これは、音声合成にとっては結構つらい状況。だって、正解がないのに「間違った」と言われるわけです。勉強頑張ろう!と思った小学生なら、塾をやめる事態なみの現象です。
実際どうなるでしょう。
実際やってみました。これは、音声合成がすごいのかすごくないのか?という評価をするための文章ではありません。
現在使っている音声合成ツールキットの中で、日本語DBがどのような登録がされているか?を検証していることになります。
テキストをご覧いただきながらお聴きください。
今から、ちょっとチャレンジしてみます。表示されている、良くありそうな文字列。でも、音声合成にとっては、結構、罠になることも多いんです。そんじゃ、やってみますね
¥1,200/個
合成戦隊ゴーセイジャー
あなたの言うことは「?」ですよ
評価:★★☆☆☆
12/24開催「Grand Game チャンピオン大会」
やまだ☆たろ、が歌います「愛・Love・U」あれ?どうでしょう。こうしてやってみると、結構私も優秀、って気がしました。でも、中の人の、中の人の、さらにその上流の人の日本語データベース作りも大変、ってことですね。時々自分が何を言わされているのか、分からなくなりますが、そういうことみたいです。
実用から登録が進む
音声合成の日本語データベースは、何に使われるか、で得意な内容が決まってきます。
例えば、カーナビ用データベースなら、地名やランドマーク。さらに新たに追加されることも多いので、3か月に一度アップデートされる、などの運用をされているものもあります。
また、同じくカーナビ。音楽データのタグで、歌手名・曲名を読み上げてくれるカーナビの場合、Official髭男dismを「おふぃしゃるひげだんでぃずむ」と読まないといけないわけで、こちらも登録と更新が行われる分野です。
コールセンター用だと、やたらと丁寧な言葉遣いを覚えさせられたりして・・・