ようこそ ゲスト さん
ログイン
入力補助
English
カテゴリ
インデックスツリー
ランキング
アクセスランキング
ダウンロードランキング
その他
法政大学
法政大学図書館
インデックスツリー
資料タイプ別
学内論文
大学院紀要=Bulletin of graduate studies
法政大学大学院紀要. 理工学・工学研究科編
法政大学大学院紀要. 理工学研究科編
法政大学大学院紀要. デザイン工学研究科編
法政大学大学院紀要. 情報科学研究科編
法政大学懸賞論文優秀論文集
法政大学国際文化学部国際社会演習トランスナショナル・ヒストリー研究卒業論文集
このアイテムのアクセス数:
81
件
(
2025-07-04
15:08 集計
)
Permalink : https://doi.org/10.15002/00026277
Permalink : https://hdl.handle.net/10114/00026277
閲覧可能ファイル
ファイル
フォーマット
サイズ
閲覧回数
説明
gradcis_18_20T2002
pdf
490 KB
57
論文情報
ファイル出力
アイテムタイプ
紀要論文
タイトル
Natural Text-Driven, Multi-Attribute Editing of Facial Images with Robustness in Sparse Latent Space
著者
著者名
Zou, Jianpeng
言語
eng
ISSN
24321192
DOI
https://doi.org/10.15002/00026277
出版者
法政大学大学院情報科学研究科
雑誌名
法政大学大学院紀要. 情報科学研究科編
巻
18
開始ページ
1
終了ページ
6
発行年
2023-03-24
著者版フラグ
Version of Record
キーワード
GAN inversion
text-driven
CLIP
StyleGAN
image editing
抄録
Due to the development of GAN and the proposal of many excellent models like StyleGAN, text-driven image editing and image generation have made great progress in recent years, but the task of generating diverse images of specific people under the guidance of text is still lacking. This paper combines two pre-training models, CLIP and StyleGAN2, to conduct a preliminary exploration of the above tasks. The latent code of the input portrait is driven to be edited and manipulated in the StyleGAN latent space via a CLIP-based text-driven module. Especially in the sparse region of the generator latent space, and when editing multiple attributes at the same time, some good results have finally been achieved.
資源タイプ
Article
書誌レコードID
AA12746425
インデックス
資料タイプ別
 > 
学内論文
 > 
法政大学大学院紀要. 情報科学研究科編
501 学内論文
 > 
紀要
 > 
法政大学大学院紀要. 情報科学研究科編
 > 
18
ホームへ戻る