Publication

Peer-reviewed paper

2023

  • Hiroki Kanagawa, Takafumi Moriya, Yusuke Ijima, “VC-T: Streaming Voice Conversion Based on Neural Transducer,” Proc. Interspeech 2023, pp. 2088-2092, Aug. 2023 @ Dubrin, Ireland. , poster
  • Kenichi Fujita, Takanori Ashihara, Hiroki Kanagawa, Takafumi Moriya, Yusuke Ijima, “Zero-Shot Text-to-Speech Synthesis Conditioned Using Self-Supervised Speech Representation Model,” Proc. ICASSP Workshops 2023, pp. 1-5, Jun, 2023
  • Hiroki Kanagawa and Yusuke Ijima, “Enhancement of Text-Predicting Style Token With Generative Adversarial Network for Expressive Speech Synthesis,” Proc. 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023), pp. 1-5, Jun. 2023 @ Rohdes island, Greece. , slide, video
  • 本間 幸徳, 金川 裕紀, 小林 のぞみ, 井島 勇祐, 齋藤 邦子, “話し方種別情報を含むテキスト対話を活用した表現豊かなテキスト音声合成,” 人工知能学会論文誌, vol.38, no.3, F-MA7_1-12, May. 2023.

2022

  • Hiroki Kanagawa and Yusuke Ijima, “SIMD-Size Aware Weight Regularization for Fast Neural Vocoding on CPU,” Proc. 2022 IEEE Spoken Language Technology Workshop (SLT 2022), pp. 955-961, Jan. 2023 @ Doha, Qutar, , , slide, poster, video
  • Hiroki Kanagawa, Yusuke Ijima, Hiroyuki Toda, “Joint Modeling of Multi-Sample and Subband Signals for Fast Neural Vocoding on CPU,” Proc. Interspeech, pp. 1626-1630, Sep. 2022 @ Incheon, Korea. , slide, poster, video
  • Hiroki Kanagawa and Yusuke Ijima, “Multi-Sample Subband Wavernn Via Multivariate Gaussian,” Proc. 2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2022), pp. 8427-8431, May. 2022 @ Singapore. , paper, slide, poster, video

2020

  • Hiroki Kanagawa and Yusuke Ijima, “Lightweight LPCNet-Based Neural Vocoder with Tensor Decomposition,” Proc. Interspeech, pp. 205-209, Oct. 2020 @ Shanghai, China. , slide

2019

  • Hiroki Kanagawa and Yusuke Ijima, “Multi-Speaker Modeling for DNN-based Speech Synthesis Incorporating Generative Adversarial Networks,” Proc. 10th ISCA Speech Synthesis Workshop (SSW 10). pp. 40–44, Sep. 2019 @ Vienna, Austria. , poster

2018

  • Takafumi Moriya, Hiroki Kanagawa, Kiyoaki Matsui, Takaaki Fukutomi, Yusuke Shinohara, Yoshikazu Yamaguchi, Manabu Okamoto, Yushi Aono, “Efficient Building Strategy with Knowledge Distillation for Small-Footprint Acoustic Models,” Proc. 2018 IEEE Workshop on Spoken Language Technology (SLT 2018), pp. 21-28, Dec. 2018,

2017

  • 金川 裕紀,太刀岡 勇気,渡部 晋治,石井 純, “音声認識のための回帰木に基づく複数の変換行列の重み付けによる特徴量空間の適応,” 情報処理学会論文誌 vol.58 no.9, pp.1555-1564, Sep. 2017.

2015

  • Hiroki Kanagawa, Yuuki Tachioka, Shinji Watanabe, Jun Ishii, “Feature-space structural MAPLR with regression tree-based multiple transformation matrices for DNN,” Proc. APSIPA Annual Summit and Conference 2015 (APSIPA ASC 2015), pp. 86-92, Dec. 2015 @ Hong Kong. , paper, slide

2013

  • Hiroki Kanagawa, Takashi Nose, Takao Kobayashi, “Speaker-independent style conversion for HMM-based expressive speech synthesis,” Proc. 2013 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2013), pp. 7864-7868, May. 2013 @ Vancouver, Canada. , paper, poster

Domestic conference (Non peer-reviewed)

2023

  • 金川 裕紀, 森谷 崇史, 井島 勇祐, “VC-T: ニューラルトランスデューサーに基づくストリーミング声質変換,” 日本音響学会 秋季研究発表会, pp. xx-xx 2023年9月 @ 名古屋工業大学. paper, slide

2022

  • 金川 裕紀, 井島 勇祐, “複数サンプル・サブバンド信号の同時モデル化による高速なニューラルボコーダー,” 日本音響学会 春季研究発表会, pp.xx-xx, 2023年3月. @ オンライン. paper, slide
  • 金川 裕紀, 井島 勇祐, “多変量ガウス分布を用いた複数サンプル生成サブバンドWaveRNNに基づく高速なニューラルボコーダー,” 日本音響学会 秋季研究発表会, pp. xx-xx 2022年9月 @ 北海道科学大学. paper, slide

2020

  • 金川 裕紀, 井島 勇祐, “テンソル分解を用いたLPCNetに基づく軽量なニューラルボコーダの評価,” 日本音響学会 春季研究発表会, pp.xx-xx, 2021年3月. @ オンライン paper, slide

2018

  • 金川 裕紀, 井島 勇祐, “DNN音声合成のための敵対的学習による複数話者モデリングの検討,” 電子情報通信学会技術研究報告, vol. 118, no. 269, SP2018-32, pp. 1-6, 2018年10月 @ 九州工業大学 百周年中村記念館 . paper, slide

2017

  • 金川 裕紀,岡登 洋平, “複数音声認識システムからのドメイン選択における特徴量の検討,” 日本音響学会 秋季研究発表会, pp.xx-xx, 2017年9月 @ 愛媛大学. paper, poster

2016

  • 金川 裕紀,太刀岡 勇気,成田 知宏: ドメイン選択による複数音声認識システムの効果的活用法, 日本音響学会 春季研究発表会, pp.25-28, 2017年3月. @ 明治大学 生田キャンパス. paper, slide
  • 金川 裕紀,太刀岡 勇気,成田 知宏: 基底fMLLRのための効率的な基底選択と重み係数推定法, 電子情報通信学会技術研究報告, SP2016-21 vol. 116 no. 165, pp.7-12, 2016年7月. @ 天童温泉 滝の湯. paper, slide
  • 金川 裕紀,太刀岡 勇気,成田 知宏: 基底fMLLRのための効率的な基底選択, 日本音響学会 秋季研究発表会, pp.35-38, 2016年9月 @ 富山大学. paper, slide

2015

  • 金川 裕紀,太刀岡 勇気,渡部 晋治,石井 純, “DNN のための複数変換行列を用いた特徴量空間の適応法,” 日本音響学会 秋季研究発表会, pp.53-56, 2015年9月 @ 会津大学. paper, slide

  • 金川 裕紀,太刀岡 勇気,渡部 晋治,石井 純, “回帰木に基づく複数の変換行列を用いた特徴量空間の適応法,” 電子情報通信学会技術研究報告, SP2015-40, pp.25-30, 2015年7月 @ かたくら諏訪湖ホテル. paper, slide

  • 金川 裕紀, 太刀岡 勇気, 石井 純, “回帰木に基づくCMLLR 変換行列の特徴量への適用法, 日本音響学会 春季研究発表会, pp.13-14, 2015年3月 @ 中央大学 後楽園キャンパス. paper, slide

2013

  • 金川 裕紀, 能勢 隆, 小林 隆夫. HMM音声合成における話者正規化学習を用いたスタイル変換法の評価, 日本音響学会 春季研究発表会, pp. 295-296, 2013年3月 @ 東京工科大学 八王子キャンパス. paper, slide
  • 金川 裕紀, 能勢 隆, 小林 隆夫, “任意話者の多様なスタイル生成のための話者正規化スタイル変換法の検討,” 電子情報通信学会技術研究報告, vol. 112, no. 422, SP2012-110, pp. 73-78, 2013年1月 @ 同志社大学 京田辺キャンパス. paper, slide

2012

  • 金川 裕紀, 能勢 隆, 小林 隆夫, “HMM音声合成における不特定話者スタイル変換のための話者正規化学習法の検討,” 日本音響学会 秋季研究発表会, pp. 431-432, 2012年9月 @ 信州大学 長野キャンパス. paper, slide

2011

  • 金川 裕紀, 能勢 隆, 小林 隆夫, “HMM音声合成における不特定話者スタイル変換の検討,” 電子情報通信学会技術研究報告, vol. 111, no. 365, SP2011-99, pp. 191-196, 2011年12月 @ 芝浦工業大学 豊洲キャンパス. paper, slide
0%