活動内容

日本声優統計学会は声優,声,アニメ作品,ラジオ,アニメソング,アニメイベント,アニメスタッフ,及び声優ファンにまつわる諸現象に対して数理統計的・機械学習的アプローチを用いて分析する集団です.

日本声優統計学会は正式な学会ではなく,同人活動を行うサークルです.

声優統計コーパス

独自に構築した音素バランス文,及びそれらをプロの女性声優 3 名が 3 パターンで読み上げた音声です.

更新履歴

詳細な変更履歴はこちら (ChangeLog.md) をご確認ください.

2020年06月23日 : PJS corpus へのリンクを追加.
2020年04月21日 : 音素バランス文の引用元である Wikipedia のエントリーページを追記.
2020年03月28日 : 音素バランス文の読みを修正.
2019年08月18日 : JVS corpus へのリンクを追加.
2018年11月21日 : Google Drive に配置したミラーファイルへのリンクを追加.
2018年06月25日 : nico-opendata 音声読み上げデータセットへのリンクを追加.
2017年12月10日 : JSUT へのリンクを追加.
2017年07月08日 : コーパス構築手法公開.
2017年07月01日 : ver 1.1 を公開.
2017年06月26日 : ver 1.0 を公開.

音素バランス文

日本語版 Wikipedia の本文データを元に, diphone の出現頻度を考慮し構築した音素バランス文です.
まず,全本文に対して MeCabNEologd を用いた読み推定を行いました.
その後,出現した diphone の上位500種が3個以上含まれるよう線形計画問題によって文集合を抽出しています.
読みから音素へのマッピングは汎用大語彙連続音声認識エンジン Julius を参考にしています.
CC-BY-SA ライセンスで配布しています.各バランス文が含まれる元エントリの URL と改変内容や備考を記したファイルはこちらです.
音素バランス文 (txt file)
音素バランス文抽出手法 (pdf file)

音声ファイル

プロの女性声優3名が3パターンの感情で音素バランス文を読み上げたファイルです.
48kHz / 16-bitの WAV ファイルであり,総長約2時間,総ファイルサイズ720MBです.

この音声ファイルは主に個人での研究・分析目的でのみ無償で利用可能です.
再配布や公序良俗に反する利用などの,実演家の著作隣接権を侵害する行為は禁止します.

同人誌や論文などで利用される場合,こちらの .bib ファイルを用いて引用していただければ幸いです.
データへの質問,誤り報告などは GitHub の Issues までお寄せ下さい.
個別の問い合わせはこちらのメールアドレスまでどうぞ.

収録,配布に際し UWAN Pictures 様にご協力頂きました.厚くお礼申し上げます.

声優統計コーパスが利用されている論文

Takaaki Saeki, Yuki Saito, Shinnosuke Takamichi, and Hiroshi Saruwatari. Lifter Training and Sub-band Modeling for Computationally Efficient and High-Quality Voice Conversion Using Spectral Differentials. ICASSP 2020.

Riku Arakawa, Shinnosuke Takamichi, and Hiroshi Saruwatari. TransVoice: Real-Time Voice Conversion for Augmenting Near-Field Speech Communication. UIST 2019.

Kento Matsumoto, Sunao Hara, and Masanobu Abe. Speech-like Emotional Sound Generator by WaveNet. APISIPA 2019.

Riku Arakawa, Shinnosuke Takamichi, and Hiroshi Saruwatari. Implementation of DNN-based real-time voice conversion and its improvements by audio data augmentation and mask-shaped device. ISCA Speech Synthesis Workshop 2019.

佐伯 高明, 齋藤 佑樹, 高道 慎之介, and 猿渡 洋. 差分スペクトル法に基づく広帯域声質変換のためのサブバンドリフタ学習. 日本音響学会2020年春季研究発表会.

佐伯 高明, 齋藤 佑樹, 高道 慎之介, 猿渡 洋. 差分スペクトル法に基づくDNN声質変換の計算量削減に向けたフィルタ推定. 日本音響学会2019年秋季研究発表会.

外部リンク

JSUT (Japanese speech corpus of Saruwatari Lab, University of Tokyo)

JSUT は東京大学 猿渡研究室が作成し,無償で公開している音声コーパスです.
JSUT には声優統計コーパスの音素バランス文を読み上げた音声 (voiceactress100) が含まれています.

nico-opendata 音声読み上げデータセット

Dwango Media Village 所属の男性研究員による,声優統計コーパス100文を読み上げた音声コーパスです.

JVS (Japanese versatile speech) corpus

JVS corpus は東京大学 猿渡研究室が作成し,無償で公開している音声コーパスです.
JVS corpus には声優統計コーパスの音素バランス文を100人のプロフェッショナル話者 (声優・俳優など) が読み上げた音声 (parallel100) が含まれています.

PJS: Phoneme-balanced Japanese Singing-voice corpus

PJS corpus は Junya Koguchi 氏が作成し,無償で公開している歌声コーパスです.
PJS corpus には声優統計コーパスの音素バランス文を歌詞にメロディを付与した歌が含まれています.

発表文献

「声優統計」および「声優統計論文集」の頒布は終了しました.
ご愛読いただきありがとうございました.

声優統計 第九号 (最終号) (C91, 2016.12.30, R23-A)

  • 前書き (@R_Linux)
  • 声優力 : 第二の種田梨沙を探せ (@Med_KU)
  • きららフェスタ2016 : 観客動員数No.1 は誰だ (@Med_KU)
  • 声優統計特別研究員 : 声優統計による研究費獲得への道 (@Med_KU)
  • テレビアニメにおける新人声優とその傾向について (@kkobayashi)
  • seiyu2vec : 声優の潜在表現と評価 ( @y_benjo and @MagnesiumRibbon)
  • 二次配布可能な音素バランス文と声優統計音声コーパスの構築 (@y_benjo)
  • 黒沢ともよさんの音楽嗜好に基づくロックフェス推薦システムに関する取り組み(@wakuteka)

声優統計 第八号 (C90, 2016.08)

  • なれる!声優~Deep Learning を利用した声質変換~ (@asteerism)
  • 声優しりとり (@Med_KU)
  • 複数声優歌唱楽曲における歌唱パート特定問題 --声優統計的ハイレゾのススメ-- (@MagnesiumRibbon)
  • 「他界」の科学 (2) : 個別の感染症モデルにもとづくイベント参加予測 (@y_benjo)
  • 会いにいける賃貸住宅を求めて (@wakuteka and @y_benjo)

声優統計 第七号 (C89, 2015.12)

  • 結婚したら声優は仕事が減るのか? --種田梨沙が結婚したら僕はもう…-- (@Med_KU)
  • 日本声優統計学会 投稿&査読ガイド --声優統計の読み方・書き-- (@MagnesiumRibbon)
  • 「他界」の科学 : 限界効用逓減と代替財を考慮した声優イベント参加モデル (@y_benjo)
  • Wikipediaとラジオでの楽曲選択に基づく黒沢ともよさんの音楽嗜好推定 (@wakuteka)
  • Bluemix × Watson × 声優 (@kkobayashi)

声優統計 第六号 (C88, 2015.08)

  • 序文 : 人工声優は東京ドーム公演の夢を見るか? - (@hitoshi_ni)
  • イベント出演状況から予想するネクストブレイク声優 (@kkobayashi)
  • 同一セリフからの声優と心情の同時推定問題 -- 声優統計標準ベンチマークの提案 (@MagnesiumRibbon)
  • ダメ絶対音感:レベル・ネオは早見沙織? 日笠陽子? (@Med_KU and @biochem_fan)
  • 青田買いの神話 : 青田買いを考慮した製品普及モデルにもとづく声優分析 (@y_benjo)
  • 脇役識別問題 - :-)

声優統計 第五号 (C87, 2014.12)

  • 田村ゆかりは永遠の 17 歳なのか? - CV から見た声年齢の推移 - (@harapon)
  • 現役女子高生声優とその周辺事情 (@kkobayashi)
  • 晴れ声優もしくは雨声優に対する統計学的考察 (@MagnesiumRibbon)
  • Twitterの投稿時間分布から見る声優の生態 (@Med_KU and @biochem_fan)
  • パンツを求めて 総務
  • 主役力 : キャストの表記順に着目したプレイヤーレーティング (@y_benjo)
  • 声優の食事内容の検討 - 外食声優を求めて - (所沢義夫)

声優統計 第四号 (C86, 2014.08)

  • 序文: 声優と統計とシンギュラリティ -- 声優統計の目指す未来 -- (@MagnesiumRibbon) [sample]
  • 種田梨沙が出演すると百合アニメか?: Propensity score matching による検討 (@Med_KU and @biochem_fan)
  • 声優ファンが今推したいアイドル (@kkobayashi)
  • [WIP] 声優固有のアニメ顔は存在するか: Deep Learning を用いたアニメ画像キャスティング一致問題 (@y_benjo)
  • 声優統計未解決問題 (@y_benjo and @MagnesiumRibbon)

声優統計 第三号 (C85, 2013.12)

  • 序文: 声優統計における言語情報と非言語情報 -- 『声優統計』第三号に寄せて -- (@langstat)
  • 声優も「箱で推せ!」 -- 声優ファンにおける推し声優コミュニティの検出 -- (@kkobayashi) [sample]
  • ソーシャルな声優イベント参加履歴に基づく声優ファン行動の定量化分析 (@MagnesiumRibbon) [sample]
  • アニメ,声優,二次創作における百合ネットワークの考察 (@Med_KU and @biochem_fan)
  • 複数の声優によるセリフの音響的類似性の考察:不愉快です (@Med_KU)
  • 続・続・声優統計入門 -- 初めてのテキストマイニング -- (@R_Linux)
  • 今会いに行ける声優: ブログに登場する位置情報単語を用いた声優の出現位置予測 (@y_benjo)
  • 声優の結婚時期予測2013: 2012年予測の精度,変化 (@y_benjo)
  • Twitterからみる声優ファンのネットワーク構造 (@ysks3n)

声優統計 第二号 (C84, 2013.08)

  • 序文 「日本声優統計学会に寄せて」 (@toddler2009)
  • トピックモデルを用いたニコニコ動画コメントデータの声優トピック流行推移解析 (@Med_KU and @biochem_fan)
  • 声優活動における「元アイドル」の影響予測 (@kkobayashi)
  • 声優ブログの「ご報告」エントリ自動検出システムの検討 (@MagnesiumRibbon) [sample]
  • 続・声優統計入門 −− 貧乳と巨乳の狭間で −− (@R_Linux)
  • 音声による既婚声優の判別問題 (@y_benjo)
  • Labeled LDAを用いた声優のニコニコ動画における特徴的コメントの抽出 (@y_benjo)

声優統計 第一号 (C83, 2012.12)

  • 日本声優統計学会発足のご挨拶 -声優と科学の融合を目指して (@MagnesiumRibbon) [sample]
  • Wikipediaの声優PVデータ特性とブレイク判定手法 (@kkobayashi)
  • キャスティング情報のbag-of-声優モデルを用いた音響監督推定問題 (@MagnesiumRibbon)
  • 声優統計入門 (@R_Linux)
  • ブログを用いた女性声優の結婚時期予測問題 (@y_benjo) [sample]
  • アニメの内容及びキャスティングを用いないDVD売上予測問題 (@y_benjo)

連絡先