001: 音声合成の正しい使い方を音声合成自ら説明

音声合成の正しい使い方を音声合成自ら説明

音声合成をしゃべりそうなロボット

アナウンスの簡易版、として考えたら少し違います

最新技術の音声合成は、人間の代わりとしての使い道もできそうですが、どこかで人間の劣化版、となる部分もあります。

音声合成は、人間ではできないことをさせた方が良い、というのが自分が考える使い方です。例えば、感情に訴える音声は人間にはかないません。目指すべきは、音声合成ならでは、のコンテンツと使い方で新たな活用だと考えています。何十年の使い手として、開発経験者として。

まだ活用の伸びしろはある

音声合成は、スマートスピーカーの台頭、駅のアナウンス、場合によってはTV番組、Youtubeの解説音声、朗読コンテンツ、などで、かなり使う人も聴く人も増えてきました。

でも、特性をうまく活用できていないケースも。

このブログでは、音声合成による音声合成のための音声合成の説明、というコンセプトで、ツイッター投稿もしながら、使い方のコツをまとめていきます。

(@gouseichanをフォローしてください)

これからの記事をお読みいただくと、音声合成の合理的な使い方が分かり、新たなコンテンツやサービスへ広がっていく可能性が増えます。断言。

まずは音声合成による自己紹介

ツイッターでも展開したコンテンツです。テキストをご覧になりながら、お聴き下さい。

こんにちわー。音声合成のまだ名前が無い人です!
これから、音声合成による音声合成のための音声合成のお話をしていきます!
音声合成は、今は色々なところで使われているけど、結構癖があるんだよね。その辺のところを、音声合成で実際に説明していきます。
まだ名前も姿もないので、募集もしています。気軽にDMに送ってください!それじゃ、また!

ここからの実例は、この子(名前はまだ20210111時点ではありません)にお願いをして、この中の人の中の人がさらに解説を加えていきます。

この子、という表現

音声合成の声に対し、「この子」という表現をしました。犬が可愛くてそう呼んでるのとは違います。いや、少し似ているところもありますが、意味があります。

つまり、合成音には人格が付随しがち、ということです。文字だけの情報提供との違いの一つで、かなり大きい要素、と考えています。

このテーマは「音声合成とはどう使うか」の根源にも関わり、また深いのでまた後程展開しますが、溺愛してそう呼んでいるのではない、ということを言っておきたい!

このブログの効用

音声合成を理解したり考えたりせずに使う人と、理解して考えて使う人。当然コンテンツの質にちゃんと差が出ます。

ぜひこのブログでお伝えするノウハウを知っていただき、よりよい使い手になってください。

なぜか、こんな上から目線になってしまいますが、なぜかといいますと・・・

自分は、ロボットみたいな声しかできなかった時代から、音声合成をコンテンツに使ったり、開発そのものに関わったりしてきたから、なのです。

  • 8ビット機でなんとかキャラの声を作りたく、苦労して簡易的な合成
  • 16ビット機で五十音をばらして並べる超簡易合成
  • ARM7で、全ての波形を計算で行う音声合成
  • 音声合成のみのラジオ番組作成
  • ペッパーのシナリオ多数

などなど。こういうのをやってきたので、あーしたいなー、こーしたいなー、がたまりまくっているのです。

上から目線、というよりも、今も使い手側として、奮闘中なわけです。

続編リンク集

この記事以降、少しずつ解説を増やしています。メニューから探していただくのもいいのですが、こちらにもリンクを追加していきます。

002: 音声合成の正しい使い方 音声合成の中の人自己紹介

↑こちらでは、「人格」の実例を、展開しているツイッターから引っ張ってきました。

003: 音声合成の正しい使い方 ツイッターの音声投稿を使ってます

↑ツイッターが音声投稿機能にトライしていく流れは、今後の音声合成の活用幅にとっては大きいと考えます。

004: 音声合成の正しい使い方 人間のしゃべりとは違うという事実

↑コンテンツを作る上ではずせない、「人間のしゃべりとは違う」という点について。

005: 音声合成の正しい使い方 親和性の高い技術・音声認識

↑システム的には、認識といっしょに使われるサービスもあります。こちらの知識もあった方が良いです。

006: 音声合成の正しい使い方 特徴というか特長、まずは得意技

↑まずは得意な点を実例で紹介しています。実際の音を聴いてください。

007: 音声合成の正しい使い方 イントネーションって複雑

↑日本語のイントネーションルールを知ることも、合成を使いこなすコツになります。

008: 音声合成の正しい使い方 苦手なこと=決められたルール

↑CPU上のプログラムで動作しますから、当然そのプロトコルが反映されます。それを知っていれば、使う時に便利。

009: 音声合成の正しい使い方 どうぶつの森のモノマネ

↑なんでもしゃべれば正義か、という問題。ちなみに、モノマネしてみました。合ってるか分からないけど。

010: 音声合成の正しい使い方 感情表現をネロとパトラッシュで

↑感情を表現できないけど、文章で泣け!泣けるか!?

012: 音声合成の正しい使い方 あの地方の方言なら・・・

↑感情に続き、方言について。結構難しいんです。

013: 音声合成の正しい使い方 それじゃ方言や感情はできないの?

↑感情・表現は難しい、でもなんとかできることが無いのか!?

014: 音声合成の正しい使い方 最初の録音で「冷たくしゃべって」

↑ある方法で、感情を表現してみました。「冷たいしゃべり」です。

015:音声合成の正しい使い方 「よくある表記」がよくない!

↑商業的に「よくある」タイプの表記は、合成にとって「よくない」というお話です。

016: 音声合成の遊び タモリさんも遊んでいたハナモゲラ語川柳

↑まったくのめちゃくちゃな言葉。これが合成でどのように使われるのでしょう。

017: 音声合成の技術 パラメータ その1声の高さ

↑色々とエディットできる音声合成。声の高さは、一番手軽で一番大きな違いになるかも。

018: 音声合成 テキストが簡単にしゃべれる、ということ

↑手軽、ってことは、頭の中に浮かんだ最初の言葉を手軽に試す・・・そこの男子!なにを書いてるの!?

 

もう普通に買えたりします。

組み込みが好きな人はこういうのも。


組み込むときは、案外普通のサウンド系と変わりませんが、リアルタイム処理とバッファについては、少しケアする必要はあります。

 

最新情報をチェックしよう!