VOICEVOXに長音を発音してもらう

こんにちは、MIS.W50代のberryです。

この記事はみす老人会 Advent Calendar 2023 12日目の記事です。

フリーの合成音声ソフトで好きなことを好きなキャラにしゃべってもらおう!

はじめに

この記事の内容はほぼVOICEVOXの紹介&宣伝です。よろしくお願いします。

voicevox.hiroshiba.jp

タイトルの内容は「長音を発音する」のところを見てくださいませ。

なお参考文献として紹介しようとしていた方が去年長音に関する動画を上げられていたので、書こうとしていたことは下記の動画でほぼ解決することが分かってしまいました。

www.nicovideo.jp

よいこの老人は本文を書き始める前に軽くでも下調べをしよう!

合成音声とは?

合成音声は、人工的に生成された音声のことを指します。合成音声を作ることは音声合成というのでややこしい。

音声合成は基本的に歌声と話し声の二種類に分けられます。 テキストから歌声(ボーカロイド等)、テキストから話し声(ボイスロイド等)ですね。

この記事で取り上げるVOICEVOXはテキストから話し声を合成するものです。

余談

音声合成ソフトはキャラクターごとに声のもととなる人間がおり、歌声であれば歌い手や声優、話し声であればVtuberや声優などがソフトの学習元になるケースがパターンが多いですが、なんと中の人が存在しない子もいます。

第三世代キャラクターヒューマノイド 試作0号機 HCI3-P0 足立レイ

すごい

VOICEVOX

VOICEVOXは「ヒホ(ヒロシバ)」氏によって開発されたフリーのソフトウェアで、現在30人(?)のキャラクターが利用できます。こちらは人間の声を元にディープラーニングの力を使って音声合成をやっています。

ちなみに栗田まろんという女装男子大学生の中の人はniconico代表の人だったりします。ウケる

VOICEVOXの特徴

まずVOICEVOXの基本操作方法は公式の使い方ページを見てください。

基本的な流れは

  1. しゃべってもらいたい文章を入力
  2. 読み仮名の微調整
  3. 大まかなイントネーション調整
  4. 細かいイントネーション修正
  5. 細かい音の長さ修正
  6. 出力

になります。非常に細かいイントネーション調整ができるので楽しいです。

長音を発音する

かすれる

そんなボイボ(VOICEVOX)にも苦手なことがあり、長音を長い時間発音しようとすると声がかすれてしまう事が多いです。

まずはこちらをお聞きください。

声が掠れているというよりもはや電気を流されているような音になっていますね。

原理はよくわかりませんが、母音が複数繋がった場合に1つ分の母音を2つ分の長さに無理やり伸ばそうとしたりしてるんじゃないでしょうか。(適当)

VOICEROIDはかすれない

VOICEROID2では長音の数だけ母音がループ再生されているような声がします(適当)

ゆかりさんです。抑揚を0にしてループっぽさが分かりやすくなるようにしています。

かすれたくない

ボイボで母音が連続するとかすれてしまうなら、連続させなければよいです。

間に発音を邪魔しないような子音を挟むと解決できます。

「あ」の間に「ん」を挟むずんだもん

これだけではずんだもんがあんあん言うだけなので良くないです。発音を邪魔しないようにするために「ん」の長さを短くする必要があります。

「ん」を短くされたずんだもん

また、「ん」の長さを完全に0にすると母音が連続している判定になるので、0.010ぐらいは残してあげましょう。

これでかすれないはずです!再生してみましょう。

かすれてはいませんがちょうど半分あたりで音の高さが急激に変化する部分ができてしまっています。

またしても原因はわかっていませんが、同じような高さの同じような音が続くとこうなる気がします。なのでちょうど半分あたりの「ん」の音の高さを変えてあげます。

これで今度こそきれいにつながりました!

その他のボイボ調声

じゅごんさんによる解説動画が出ているので見てみてください。(過呼吸もあるよ)

www.nicovideo.jp

みんなも自分だけの謎調声を見つけ出そう!

まとめ

VOICEVOXをよろしくおねがいします。

あわよくばボイボを使って動画を作って投稿してくださいおねがいします!

使用したキャラクター・ソフト

voicevox.hiroshiba.jp

voicevox.hiroshiba.jp

www.ah-soft.com

www.ah-soft.com