【驚愕】「自分に似た声」を作るアプリが無料で公開!36〜40万円が相場の音声合成業界に価格破壊の風 | あまえび速報

【驚愕】「自分に似た声」を作るアプリが無料で公開!36〜40万円が相場の音声合成業界に価格破壊の風

 002523

「自分に似た声」を作るアプリが無料で公開! ( ´・ω・)y─┛~~~oΟ◯

1 :きらら ★ 2018/06/08(金) 16:54:20.37 CAP_USER9.net
002522

みなさんは自分の声そっくりにしゃべる合成音声をお持ちだろうか? 
筆者は2年4カ月前から自分の声「松尾P」を使えるようになっていて、たまに記事で使っている。ちょっとした自慢だ。
ところがこの先行者特権が失われようとしている。
4月17日に東芝デジタルソリューションズが公開したモバイルアプリ「コエステーション」が原因だ。
自分の観測範囲でもかなりの人が自分の合成音声「コエ」を持ち始めている。
コエステーションは、自分の声で10個の文を読み上げるだけで自分の声を基にした「コエ」ができて、
TTS(Text to Speech)による発声をアプリ内でできる。しかも無料。
これはとんでもない価格破壊だ。

これがどのくらいの価格破壊かというと、既存の音声合成企業が提供しているカスタムボイス作成では
40万円(AITalk Custom Voice)、36万円(ボイスター ライト版)と、簡単に手を出せる価格ではない。
筆者の声をモデル化した「松尾P」は、HMM(隠れマルコフモデル)を使った音声合成だ。
オープンソース版のTTSであるOpen JTalkと、それを商用化したCeVIOがこの技術に基づいている。
CeVIOはTTSだけでなく、歌唱合成もできて、故・三波春夫の歌声を合成することもできる。
歌声合成のオープンソース版はSinsyで、筆者の歌声(英語のみ)を合成して歌わせることもできる。

■HMMを使った音声合成Open JTalk

このOpen JTalkを元にしたWindowsアプリにSHABERUというものがある。
無料で様々な音声を使ってしゃべらせることができるアプリだ。
作者のアキヒロさんはOpen JTalkで用いられているhtsvoice形式の音響モデル作成を無料で提供していて、
筆者は自分で収録したサンプル文をアキヒロさんに送り、データベース化作業をアキヒロさんがやってくれたのだ。
通常、特定の声の音声合成モデルを作成するためには、音素の組み合わせを網羅した
たくさんの文章を読み上げ、そこからモデル化する。
よく使われている例文はATR503音素バランス文というもの。
htsvoice構築にも通常はこの文章を用いる。アキヒロさんは独自のバランス文を用いて、
200程度の文章で可能にしているが、それでもなかなかの作業だ。
htsvoiceの作成にはLinuxと様々なツールをインストールし、そのシステム構築は大変だ。
やり方を自分でも模索してみたが、独力でできる気はまったくしない。

■コエステーションはいきなりできたわけではない
そしてコエステーションである。
なぜいきなり東芝子会社がこんな技術をと思うかもしれないが、東芝は音声合成で長い歴史を持つ老舗なのだ。
2001年に終了してしまったLaLaVoiceというTTSのパッケージソフトを持ち、dynabook(当時はDynaBook)にバンドルしていた。
LaLaVoiceには簡易的な歌声合成機能もあり、登場時期はVOCALOIDよりも早かった。

LaLaVoiceが終了した後で登場したToSpeakは現在、東芝デジタルソリューションズのクラウドAIである
RECAIUSで使われている音声合成エンジンと位置付けられている。
人に似せた声でしゃべるカスタムボイス機能は実証済みだ。
2016年に人気パーソナリティーである小林克也さんが録音した数時間分の音声から作り出された合成音声「コバカツ君」がそれだ。
このときはRECAIUS音声合成ソフトサービスとして紹介されている。
さすがスネークマンだけあって日本語だけでなく英語も流暢にしゃべり、歌もうたう。

■小林克也さんの声から作り上げた「コバカツ君」はFM NACK5の放送でも使われた

コエステーションはこうした手間のかかるカスタマイズをiOSアプリでやってしまうというところが画期的だ。
iPhoneかiPadと付属のEarPodsイヤフォンがあれば、自分の声に似た合成音声を作り、実際に使うことができる。
それも最初は10の文を読み上げるだけでよい。

Open JTalkの場合は503、少なくとも200以上の文を安定した状態で読み上げる必要があった。
しかもその処理には複数のアプリを組み合わせたLinuxをぶんまわす必要がある。
コエステーションはiOSアプリの中で読み上げると1文ずつサーバに送られる。
10文を読み上げると第1段階「コエレベル1」クリアだ。

コエレベルは最高で5。コエレベル1は10文、レベル2は50文、レベル3は100文、レベル4は150文。
筆者は200文を読み上げ、最終段階のレベル5に到達している。
ここまでくると、品質はかなり高く、少し荒削りなところもあるOpen JTalkより柔和で本人に近く聞こえるようだ。

動画 https://youtu.be/0g06LxUIZ4E



http://www.itmedia.co.jp/news/articles/1806/08/news104.html


2 :名無しさん@1周年 2018/06/08(金) 16:54:50.91 3LWynXOf0.net
これはあかん
3 :名無しさん@1周年 2018/06/08(金) 16:55:42.72 QPlUgAkB0.net
音声セキュリティ終わったな
4 :名無しさん@1周年 2018/06/08(金) 16:56:12.51 H/vHSRWH0.net
俺の声は美輪明宏似
5 :名無しさん@1周年 2018/06/08(金) 16:56:42.31 KPukoTu+0.net
バーチャン オレオレ
8 :名無しさん@1周年 2018/06/08(金) 16:57:45.17 6aFrrbr80.net
せやかて工藤!!
12 :名無しさん@1周年 2018/06/08(金) 17:00:33.10 VT2mgIld0.net
自分の声を聴いた時のショックは忘れない
14 :名無しさん@1周年 2018/06/08(金) 17:01:34.56 MZ3aqUZO.net
これで好きな声優の音声で朗読出来る?
小山力也風で老人と海を聴きたい
16 :名無しさん@1周年 2018/06/08(金) 17:02:06.89 vgXxzRzQ0.net
東芝は無料にして、何で利益を上げるんだろ
42 :名無しさん@1周年 2018/06/08(金) 17:28:33.59 kPcbqWQb0.net
>>16
有料で利益を上げられないなら、無料にする事で活路を見いだす事も出来る
利用は無料なのに収益を上げている企業はいくつか想像出来るだろ?
ただ、シェアを奪えないと意味が無いけれどね
17 :名無しさん@1周年 2018/06/08(金) 17:02:08.37 xUSDNUyR0.net
PC用なら今でも無料ソフトあるじゃん
18 :名無しさん@1周年 2018/06/08(金) 17:02:18.30 yNX+EWU90.net
いや、自分の声が欲しいわけじゃないんだが。
19 :名無しさん@1周年 2018/06/08(金) 17:03:25.59 6aFrrbr80.net
つんくは喜ぶだろう
20 :名無しさん@1周年 2018/06/08(金) 17:03:46.73 sjtqaBf30.net
声優業廃業か
21 :名無しさん@1周年 2018/06/08(金) 17:04:30.34 8F6gkyY40.net
普通の人は声の訓練なんてしないからな。
ユーチューバーにすらなれない
24 :名無しさん@1周年 2018/06/08(金) 17:05:49.65 Cvp9qmbJ0.net
リンク先を見たけど
まだまだのレベルだった。
25 :名無しさん@1周年 2018/06/08(金) 17:06:01.51 28cMyJ9/0.net
クレーマー対策にうってつけだな
26 :名無しさん@1周年 2018/06/08(金) 17:06:04.62 645X76Qq0.net
ゲームの主人公がプレーヤーの声で喋るとか

エロゲにしか需要なさそうだけど
27 :名無しさん@1周年 2018/06/08(金) 17:06:21.31 YqaWTJky0.net
AIが声優の本業を奪うのも近いのか
28 :名無しさん@1周年 2018/06/08(金) 17:07:08.34 FQkRX52T0.net
iPhoneしかなかった
29 :名無しさん@1周年 2018/06/08(金) 17:07:16.99 cPlVmK980.net
音声認証オワタという事?
32 :名無しさん@1周年 2018/06/08(金) 17:08:19.47 6aFrrbr80.net
女性の声は、あきらかに抜けてる周波数があるけどね

まあ男性の声より女性、子供の声のほうが難しいだろうね
37 :名無しさん@1周年 2018/06/08(金) 17:10:36.66 puk0Yyfq0.net
政界も含め、有名人の爆弾発言ゴッコが溢れそうだwww
40 :名無しさん@1周年 2018/06/08(金) 17:17:57.44 ezG/5GGl0.net
声を盗まれるぞ
45 :名無しさん@1周年 2018/06/08(金) 17:36:45.98 3beiZA+o0.net
全員森本レオも可能なんだな
47 :名無しさん@1周年 2018/06/08(金) 17:41:18.89 A5C9uz3u0.net
コレにミクの音声で喋らせたらどうなる?
48 :名無しさん@1周年 2018/06/08(金) 17:45:53.13 9HnvCGte0.net
ここはやはり峰不二子の声使ってあんなことやこんなこと
50 :名無しさん@1周年 2018/06/08(金) 17:50:57.91 xZqvcHN90.net
取得できうる限りの個人情報をステガノグラフィー的に、音声データに埋め込んでおかないと
犯罪に利用された時に追跡できない
53 :名無しさん@1周年 2018/06/08(金) 17:53:00.75 l1z8BnH00.net
>>50
そもそも個人認証、認知の方法が
声なんて時代が終わるのかもよ
52 :名無しさん@1周年 2018/06/08(金) 17:51:06.68 EbiRvkl00.net
人に与える印象は声そのものよりしゃべり方の方がよっぽど重要
68 :名無しさん@1周年 2018/06/08(金) 18:15:26.69 PhqwSmEN0.net
亡くなった恋人の声を再現できたら嬉しい
69 :名無しさん@1周年 2018/06/08(金) 18:15:32.24 LbSOBka60.net
照れくさくて言えない言葉をアプリに言わせて、かわいい子ゲットだぜ。


1001: (´・ω・`) 名無しのえび速さん 2099/1/1(日) 13:57:17.37 ID:ebisoku
【画像】こんなエッチな身体の女子アナが地上波に出てていいのかよwwwwwwww
【必見】人気グラドルが露出エロ衣装を着た結果wwwwwwww
【エロ注意】ワイ、このエロ漫画がエッチすぎて抜くwwwwww
【ガン見】ロシアのJKエロ過ぎワロタwwwwwww
【エロ注意】水泳部女子のエッロいエッロいプリケツwwwwwwwwwwww
【朗報】小学生に巨乳化傾向・10歳からブラジャー当たり前wwwwwww



コメント

コメントを残す

メールアドレスが公開されることはありません。

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

post date*

アクセスランキング