Publication

Anonymous

2023-10-04 2023-10-04 751 words 4 minutes

Contents

Peer-reviewed paper

2024

Hiroki Kanagawa, Takafumi Moriya, Yusuke Ijima, “Pre-training Neural Transducer-based Streaming Voice Conversion for Faster Convergence and Alignment-free Training,” Proc. Interspeech 2024, pp. 2755-2759, Aug. 2024 @ Kos, Greece.
Hiroki Kanagawa and Yusuke Ijima, “Knowledge Distillation from Self-Supervised Representation Learning Model with Discrete Speech Units for Any-to-Any Streaming Voice Conversion,” Proc. Interspeech 2024, pp. 4393-4397, Aug. 2024 @ Kos, Greece.

2023

Hiroki Kanagawa, Takafumi Moriya, Yusuke Ijima, “VC-T: Streaming Voice Conversion Based on Neural Transducer,” Proc. Interspeech 2023, pp. 2088-2092, Aug. 2023 @ Dubrin, Ireland. , poster
Kenichi Fujita, Takanori Ashihara, Hiroki Kanagawa, Takafumi Moriya, Yusuke Ijima, “Zero-Shot Text-to-Speech Synthesis Conditioned Using Self-Supervised Speech Representation Model,” Proc. ICASSP Workshops 2023, pp. 1-5, Jun, 2023
Hiroki Kanagawa and Yusuke Ijima, “Enhancement of Text-Predicting Style Token With Generative Adversarial Network for Expressive Speech Synthesis,” Proc. 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023), pp. 1-5, Jun. 2023 @ Rohdes, Greece. , slide, video
本間幸徳, 金川裕紀, 小林のぞみ, 井島勇祐, 齋藤邦子, “話し方種別情報を含むテキスト対話を活用した表現豊かなテキスト音声合成,” 人工知能学会論文誌, vol.38, no.3, F-MA7_1-12, May. 2023.

2022

Hiroki Kanagawa and Yusuke Ijima, “SIMD-Size Aware Weight Regularization for Fast Neural Vocoding on CPU,” Proc. 2022 IEEE Spoken Language Technology Workshop (SLT 2022), pp. 955-961, Jan. 2023 @ Doha, Qutar, , , slide, poster, video
Hiroki Kanagawa, Yusuke Ijima, Hiroyuki Toda, “Joint Modeling of Multi-Sample and Subband Signals for Fast Neural Vocoding on CPU,” Proc. Interspeech, pp. 1626-1630, Sep. 2022 @ Incheon, Korea. , slide, poster, video
Hiroki Kanagawa and Yusuke Ijima, “Multi-Sample Subband Wavernn Via Multivariate Gaussian,” Proc. 2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2022), pp. 8427-8431, May. 2022 @ Singapore. , paper, slide, poster, video

2020

Hiroki Kanagawa and Yusuke Ijima, “Lightweight LPCNet-Based Neural Vocoder with Tensor Decomposition,” Proc. Interspeech, pp. 205-209, Oct. 2020 @ Shanghai, China. , slide

2019

Hiroki Kanagawa and Yusuke Ijima, “Multi-Speaker Modeling for DNN-based Speech Synthesis Incorporating Generative Adversarial Networks,” Proc. 10th ISCA Speech Synthesis Workshop (SSW 10). pp. 40–44, Sep. 2019 @ Vienna, Austria. , poster

2018

Takafumi Moriya, Hiroki Kanagawa, Kiyoaki Matsui, Takaaki Fukutomi, Yusuke Shinohara, Yoshikazu Yamaguchi, Manabu Okamoto, Yushi Aono, “Efficient Building Strategy with Knowledge Distillation for Small-Footprint Acoustic Models,” Proc. 2018 IEEE Workshop on Spoken Language Technology (SLT 2018), pp. 21-28, Dec. 2018,

2017

金川裕紀，太刀岡勇気，渡部晋治，石井純, “音声認識のための回帰木に基づく複数の変換行列の重み付けによる特徴量空間の適応,” 情報処理学会論文誌 vol.58 no.9, pp.1555-1564, Sep. 2017.

2015

Hiroki Kanagawa, Yuuki Tachioka, Shinji Watanabe, Jun Ishii, “Feature-space structural MAPLR with regression tree-based multiple transformation matrices for DNN,” Proc. APSIPA Annual Summit and Conference 2015 (APSIPA ASC 2015), pp. 86-92, Dec. 2015 @ Hong Kong. , paper, slide

2013

Hiroki Kanagawa, Takashi Nose, Takao Kobayashi, “Speaker-independent style conversion for HMM-based expressive speech synthesis,” Proc. 2013 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2013), pp. 7864-7868, May. 2013 @ Vancouver, Canada. , paper, poster

Domestic conference (Non peer-reviewed)

2024

金川裕紀, 井島勇祐, “表現力豊かな音声合成に向けたテキストからのスタイルトークン埋め込み予測の強調,” 日本音響学会春季研究発表会, pp. xx-xx 2024年3月 @ 拓殖大学. (原稿、スライド掲載準備中…)

2023

金川裕紀, 森谷崇史, 井島勇祐, “VC-T: ニューラルトランスデューサーに基づくストリーミング声質変換,” 日本音響学会秋季研究発表会, pp. xx-xx 2023年9月 @ 名古屋工業大学. paper, slide

2022

金川裕紀, 井島勇祐, “複数サンプル・サブバンド信号の同時モデル化による高速なニューラルボコーダー,” 日本音響学会春季研究発表会, pp.xx-xx, 2023年3月. @ オンライン. paper, slide
金川裕紀, 井島勇祐, “多変量ガウス分布を用いた複数サンプル生成サブバンドWaveRNNに基づく高速なニューラルボコーダー,” 日本音響学会秋季研究発表会, pp. xx-xx 2022年9月 @ 北海道科学大学. paper, slide

2020

金川裕紀, 井島勇祐, “テンソル分解を用いたLPCNetに基づく軽量なニューラルボコーダの評価,” 日本音響学会春季研究発表会, pp.xx-xx, 2021年3月. @ オンライン paper, slide

2018

金川裕紀, 井島勇祐, “DNN音声合成のための敵対的学習による複数話者モデリングの検討,” 電子情報通信学会技術研究報告, vol. 118, no. 269, SP2018-32, pp. 1-6, 2018年10月 @ 九州工業大学百周年中村記念館 . paper, slide

2017

金川裕紀，岡登洋平, “複数音声認識システムからのドメイン選択における特徴量の検討,” 日本音響学会秋季研究発表会, pp.xx-xx, 2017年9月 @ 愛媛大学. paper, poster

2016

金川裕紀，太刀岡勇気，成田知宏: ドメイン選択による複数音声認識システムの効果的活用法, 日本音響学会春季研究発表会, pp.25-28, 2017年3月. @ 明治大学生田キャンパス. paper, slide
金川裕紀，太刀岡勇気，成田知宏: 基底fMLLRのための効率的な基底選択と重み係数推定法, 電子情報通信学会技術研究報告, SP2016-21 vol. 116 no. 165, pp.7-12, 2016年7月. @ 天童温泉滝の湯. paper, slide
金川裕紀，太刀岡勇気，成田知宏: 基底fMLLRのための効率的な基底選択, 日本音響学会秋季研究発表会, pp.35-38, 2016年9月 @ 富山大学. paper, slide

2015

金川裕紀，太刀岡勇気，渡部晋治，石井純, “DNN のための複数変換行列を用いた特徴量空間の適応法,” 日本音響学会秋季研究発表会, pp.53-56, 2015年9月 @ 会津大学. paper, slide
金川裕紀，太刀岡勇気，渡部晋治，石井純, “回帰木に基づく複数の変換行列を用いた特徴量空間の適応法,” 電子情報通信学会技術研究報告, SP2015-40, pp.25-30, 2015年7月 @ かたくら諏訪湖ホテル. paper, slide
金川裕紀, 太刀岡勇気, 石井純, “回帰木に基づくCMLLR 変換行列の特徴量への適用法, 日本音響学会春季研究発表会, pp.13-14, 2015年3月 @ 中央大学後楽園キャンパス. paper, slide

2013

金川裕紀, 能勢隆, 小林隆夫. HMM音声合成における話者正規化学習を用いたスタイル変換法の評価, 日本音響学会春季研究発表会, pp. 295-296, 2013年3月 @ 東京工科大学八王子キャンパス. paper, slide
金川裕紀, 能勢隆, 小林隆夫, “任意話者の多様なスタイル生成のための話者正規化スタイル変換法の検討,” 電子情報通信学会技術研究報告, vol. 112, no. 422, SP2012-110, pp. 73-78, 2013年1月 @ 同志社大学京田辺キャンパス. paper, slide

2012

金川裕紀, 能勢隆, 小林隆夫, “HMM音声合成における不特定話者スタイル変換のための話者正規化学習法の検討,” 日本音響学会秋季研究発表会, pp. 431-432, 2012年9月 @ 信州大学長野キャンパス. paper, slide

2011

金川裕紀, 能勢隆, 小林隆夫, “HMM音声合成における不特定話者スタイル変換の検討,” 電子情報通信学会技術研究報告, vol. 111, no. 365, SP2011-99, pp. 191-196, 2011年12月 @ 芝浦工業大学豊洲キャンパス. paper, slide