音声合成の正しい使い方を音声合成自ら説明
アナウンスの簡易版、として考えたら少し違います
最新技術の音声合成は、人間の代わりとしての使い道もできそうですが、どこかで人間の劣化版、となる部分もあります。
音声合成は、人間ではできないことをさせた方が良い、というのが自分が考える使い方です。例えば、感情に訴える音声は人間にはかないません。目指すべきは、音声合成ならでは、のコンテンツと使い方で新たな活用だと考えています。何十年の使い手として、開発経験者として。
まだ活用の伸びしろはある
音声合成は、スマートスピーカーの台頭、駅のアナウンス、場合によってはTV番組、Youtubeの解説音声、朗読コンテンツ、などで、かなり使う人も聴く人も増えてきました。
でも、特性をうまく活用できていないケースも。
このブログでは、音声合成による音声合成のための音声合成の説明、というコンセプトで、ツイッター投稿もしながら、使い方のコツをまとめていきます。
(@gouseichanをフォローしてください)
これからの記事をお読みいただくと、音声合成の合理的な使い方が分かり、新たなコンテンツやサービスへ広がっていく可能性が増えます。断言。
まずは音声合成による自己紹介
ツイッターでも展開したコンテンツです。テキストをご覧になりながら、お聴き下さい。
これから、音声合成による音声合成のための音声合成のお話をしていきます!
音声合成は、今は色々なところで使われているけど、結構癖があるんだよね。その辺のところを、音声合成で実際に説明していきます。
まだ名前も姿もないので、募集もしています。気軽にDMに送ってください!それじゃ、また!
ここからの実例は、この子(名前はまだ20210111時点ではありません)にお願いをして、この中の人の中の人がさらに解説を加えていきます。
この子、という表現
音声合成の声に対し、「この子」という表現をしました。犬が可愛くてそう呼んでるのとは違います。いや、少し似ているところもありますが、意味があります。
つまり、合成音には人格が付随しがち、ということです。文字だけの情報提供との違いの一つで、かなり大きい要素、と考えています。
このテーマは「音声合成とはどう使うか」の根源にも関わり、また深いのでまた後程展開しますが、溺愛してそう呼んでいるのではない、ということを言っておきたい!
このブログの効用
音声合成を理解したり考えたりせずに使う人と、理解して考えて使う人。当然コンテンツの質にちゃんと差が出ます。
ぜひこのブログでお伝えするノウハウを知っていただき、よりよい使い手になってください。
なぜか、こんな上から目線になってしまいますが、なぜかといいますと・・・
自分は、ロボットみたいな声しかできなかった時代から、音声合成をコンテンツに使ったり、開発そのものに関わったりしてきたから、なのです。
- 8ビット機でなんとかキャラの声を作りたく、苦労して簡易的な合成
- 16ビット機で五十音をばらして並べる超簡易合成
- ARM7で、全ての波形を計算で行う音声合成
- 音声合成のみのラジオ番組作成
- ペッパーのシナリオ多数
などなど。こういうのをやってきたので、あーしたいなー、こーしたいなー、がたまりまくっているのです。
上から目線、というよりも、今も使い手側として、奮闘中なわけです。
続編リンク集
この記事以降、少しずつ解説を増やしています。メニューから探していただくのもいいのですが、こちらにもリンクを追加していきます。
↑こちらでは、「人格」の実例を、展開しているツイッターから引っ張ってきました。
003: 音声合成の正しい使い方 ツイッターの音声投稿を使ってます
↑ツイッターが音声投稿機能にトライしていく流れは、今後の音声合成の活用幅にとっては大きいと考えます。
004: 音声合成の正しい使い方 人間のしゃべりとは違うという事実
↑コンテンツを作る上ではずせない、「人間のしゃべりとは違う」という点について。
005: 音声合成の正しい使い方 親和性の高い技術・音声認識
↑システム的には、認識といっしょに使われるサービスもあります。こちらの知識もあった方が良いです。
006: 音声合成の正しい使い方 特徴というか特長、まずは得意技
↑まずは得意な点を実例で紹介しています。実際の音を聴いてください。
↑日本語のイントネーションルールを知ることも、合成を使いこなすコツになります。
008: 音声合成の正しい使い方 苦手なこと=決められたルール
↑CPU上のプログラムで動作しますから、当然そのプロトコルが反映されます。それを知っていれば、使う時に便利。
↑なんでもしゃべれば正義か、という問題。ちなみに、モノマネしてみました。合ってるか分からないけど。
010: 音声合成の正しい使い方 感情表現をネロとパトラッシュで
↑感情を表現できないけど、文章で泣け!泣けるか!?
↑感情に続き、方言について。結構難しいんです。
013: 音声合成の正しい使い方 それじゃ方言や感情はできないの?
↑感情・表現は難しい、でもなんとかできることが無いのか!?
014: 音声合成の正しい使い方 最初の録音で「冷たくしゃべって」
↑ある方法で、感情を表現してみました。「冷たいしゃべり」です。
015:音声合成の正しい使い方 「よくある表記」がよくない!
↑商業的に「よくある」タイプの表記は、合成にとって「よくない」というお話です。
016: 音声合成の遊び タモリさんも遊んでいたハナモゲラ語川柳
↑まったくのめちゃくちゃな言葉。これが合成でどのように使われるのでしょう。
↑色々とエディットできる音声合成。声の高さは、一番手軽で一番大きな違いになるかも。
↑手軽、ってことは、頭の中に浮かんだ最初の言葉を手軽に試す・・・そこの男子!なにを書いてるの!?
もう普通に買えたりします。
組み込みが好きな人はこういうのも。
組み込むときは、案外普通のサウンド系と変わりませんが、リアルタイム処理とバッファについては、少しケアする必要はあります。