ようこそ ゲスト さん
ログイン
入力補助
English
カテゴリ
インデックスツリー
ランキング
アクセスランキング
ダウンロードランキング
その他
法政大学
法政大学図書館
インデックスツリー
資料タイプ別
学内論文
大学院紀要=Bulletin of graduate studies
法政大学大学院紀要. 理工学・工学研究科編
法政大学大学院紀要. 理工学研究科編
法政大学大学院紀要. デザイン工学研究科編
法政大学大学院紀要. 情報科学研究科編
法政大学懸賞論文優秀論文集
法政大学国際文化学部国際社会演習トランスナショナル・ヒストリー研究卒業論文集
このアイテムのアクセス数:
73
件
(
2025-07-09
16:18 集計
)
Permalink : https://doi.org/10.15002/00030616
Permalink : https://hdl.handle.net/10114/00030616
閲覧可能ファイル
ファイル
フォーマット
サイズ
閲覧回数
説明
gradcis_19_22T0013
pdf
869 KB
154
論文情報
ファイル出力
アイテムタイプ
紀要論文
タイトル
継続時間を利用した話者埋め込みによるボイスクローニングの向上
その他のタイトル
Incorporating Speaker’s Speech Rate Features for Improved Voice Cloning
著者
著者名
秦, 哲
著者名
Qin, Zhe
言語
jpn
ISSN
24321192
DOI
https://doi.org/10.15002/00030616
出版者
法政大学大学院情報科学研究科
雑誌名
法政大学大学院紀要. 情報科学研究科編
巻
19
開始ページ
1
終了ページ
6
発行年
2024-03-24
著者版フラグ
Version of Record
抄録
We investigate a neural network-based text-to-speech (TTS) synthesis system that aims to simulate the Mandarin voice of different speakers using short voice samples. Our system introduces new attempts in two key parts.: (1)Unlike prior studies, we not only capture the unique voice characteristics of each speaker but also integrate a speaker feature extraction model to improve our model's effectiveness. Importantly, we utilize a duration model for accurately capturing the speech rate and rhythm of each individual, thus allowing our synthesized speech to demonstrate enhanced realism and credibility.(2) Based on the Tacotron model, we combine additional properties such as "speech rate" and "D-vector" to generate mel spectrograms from a given text, thereby enhancing the ability to clone through mechanisms such as location-sensitive attention. This ensures the quality and authenticity of the synthesized speech. Experiments have shown that this innovative approach uses less data to train and has better sound quality than previous models, and has a certain degree of reproduction in speech speed.
資源タイプ
Article
書誌レコードID
AA12746425
インデックス
資料タイプ別
 > 
学内論文
 > 
法政大学大学院紀要. 情報科学研究科編
501 学内論文
 > 
紀要
 > 
法政大学大学院紀要. 情報科学研究科編
 > 
19
ホームへ戻る