活動内容
日本声優統計学会は声優,声,アニメ作品,ラジオ,アニメソング,アニメイベント,アニメスタッフ,及び声優ファンにまつわる諸現象に対して数理統計的・機械学習的アプローチを用いて分析する集団です.
日本声優統計学会は正式な学会ではなく,同人活動を行うサークルです.
声優統計は声優を科学します
日本声優統計学会は声優,声,アニメ作品,ラジオ,アニメソング,アニメイベント,アニメスタッフ,及び声優ファンにまつわる諸現象に対して数理統計的・機械学習的アプローチを用いて分析する集団です.
日本声優統計学会は正式な学会ではなく,同人活動を行うサークルです.
独自に構築した音素バランス文,及びそれらをプロの女性声優 3 名が 3 パターンで読み上げた音声です.
(2020.11.01) あなたがライセンスがある程度自由な音素バランス文やその読み上げ音声を必要としている場合,声優統計コーパスではなく, JVS コーパスの利用を検討してください.より詳しい説明はこちらの文章をお読みください.
詳細な変更履歴はこちら (ChangeLog.md) をご確認ください.
2021年02月28日 : つくよみちゃんコーパスへのリンクを追加. 2020年11月01日 : JVS corpus の利用を推奨する告知を追加. 2020年06月23日 : PJS corpus へのリンクを追加. 2020年04月21日 : 音素バランス文の引用元である Wikipedia のエントリーページを追記. 2020年03月28日 : 音素バランス文の読みを修正. 2019年08月18日 : JVS corpus へのリンクを追加. 2018年11月21日 : Google Drive に配置したミラーファイルへのリンクを追加. 2018年06月25日 : nico-opendata 音声読み上げデータセットへのリンクを追加. 2017年12月10日 : JSUT へのリンクを追加. 2017年07月08日 : コーパス構築手法公開. 2017年07月01日 : ver 1.1 を公開. 2017年06月26日 : ver 1.0 を公開.
日本語版 Wikipedia の本文データを元に, diphone の出現頻度を考慮し構築した音素バランス文です. まず,全本文に対して MeCab と NEologd を用いた読み推定を行いました. その後,出現した diphone の上位500種が3個以上含まれるよう線形計画問題によって文集合を抽出しています. 読みから音素へのマッピングは汎用大語彙連続音声認識エンジン Julius を参考にしています. CC-BY-SA ライセンスで配布しています.各バランス文が含まれる元エントリの URL と改変内容や備考を記したファイルはこちらです. 音素バランス文 (txt file) 音素バランス文抽出手法 (pdf file)
プロの女性声優3名が3パターンの感情で音素バランス文を読み上げたファイルです. 48kHz / 16-bitの WAV ファイルであり,総長約2時間,総ファイルサイズ720MBです.
この音声ファイルは主に個人での研究・分析目的でのみ無償で利用可能です. 再配布や公序良俗に反する利用などの,実演家の著作隣接権を侵害する行為は禁止します.
同人誌や論文などで利用される場合,こちらの .bib ファイルを用いて引用していただければ幸いです. データへの質問,誤り報告などは GitHub の Issues までお寄せ下さい. 個別の問い合わせはこちらのメールアドレスまでどうぞ.
収録,配布に際し UWAN Pictures 様にご協力頂きました.厚くお礼申し上げます.
佐伯 高明, 齋藤 佑樹, 高道 慎之介, and 猿渡 洋. 差分スペクトル法に基づく広帯域声質変換のためのサブバンドリフタ学習. 日本音響学会2020年春季研究発表会.
佐伯 高明, 齋藤 佑樹, 高道 慎之介, 猿渡 洋. 差分スペクトル法に基づくDNN声質変換の計算量削減に向けたフィルタ推定. 日本音響学会2019年秋季研究発表会.
JSUT は東京大学 猿渡研究室が作成し,無償で公開している音声コーパスです. JSUT には声優統計コーパスの音素バランス文を読み上げた音声 (voiceactress100) が含まれています.
Dwango Media Village 所属の男性研究員による,声優統計コーパス100文を読み上げた音声コーパスです.
JVS corpus は東京大学 猿渡研究室が作成し,無償で公開している音声コーパスです. JVS corpus には声優統計コーパスの音素バランス文を100人のプロフェッショナル話者 (声優・俳優など) が読み上げた音声 (parallel100) が含まれています.
PJS corpus は Junya Koguchi 氏が作成し,無償で公開している歌声コーパスです. PJS corpus には声優統計コーパスの音素バランス文を歌詞にメロディを付与した歌が含まれています.
つくよみちゃんコーパスは夢前黎氏が作成し,無償で公開している音声コーパスです. つくよみちゃんコーパスは JVS コーパスに準拠した音素バランス文を,「高音ウィスパー系の14歳前後のアニメキャラクター風ボイス」で読み上げた音声が含まれています. また,一部の言葉にふりがなやアクセント記号を追加した台本も同梱されています.
「声優統計」および「声優統計論文集」の頒布は終了しました. ご愛読いただきありがとうございました.