基于样式编码的真实图像逆映射算法
A real image inverse mapping algorithm based on style coding
  
DOI:
中文关键词:  潜在空间;逆映射;样式编码;语义操纵
英文关键词:latent space; inverse mapping; style code; semantic manipulation
基金项目:中兴通讯研究基金资助项目
作者单位
尹 芹 中兴通讯股份有限公司多媒体视讯产品部,江苏 南京 210000 
方 晖 中兴通讯股份有限公司多媒体视讯产品部,江苏 南京 210000 
王金东 中兴通讯股份有限公司多媒体视讯产品部,江苏 南京 210000 
王 侃 中兴通讯股份有限公司多媒体视讯产品部,江苏 南京 210000 
晏天文 南京邮电大学 通信与信息工程学院,江苏 南京 210003 
霍智勇 南京邮电大学 通信与信息工程学院,江苏 南京 210003 
摘要点击次数: 62
全文下载次数: 21
中文摘要:
      将图像准确地逆映射到StyleGAN的潜在空间,构造能够恢复真实图像的潜码,是实现真实图像语义操纵的基础。然而现有方法将图像逆映射为1×512维W潜码,重建后的图像并不能保真恢复。为此文中提出了一种基于样式编码网络的真实图像逆映射算法,其编码器网络提取粗、中、细不同的空间尺度特征作为风格特征向量,通过组合得到W+潜码后,送入预训练的StyleGAN生成器中,利用潜在空间重构出输入真实图像。实验表明,文中算法能够构造出真实图像在潜在空间的准确逆映射的潜码,提高了图像重构的质量,从而实现优于现有技术的图像语义操纵。
英文摘要:
      Inversely mapping an image to the latent space of StyleGAN and constructing an accurate latent code that can recover the real image are crucial to the semantic manipulation of real images. However, the existing method only inversely maps the image into a 1×512 W latent code, and the reconstructed image cannot be restored with fidelity. In this regard, this paper proposes a real image inverse mapping algorithm based on a style coding network. The encoder network extracts three different spatial scale features, the coarse, the medium, and the fine, as style feature vectors. After the W+ latent code is obtained by combination, the input real images reconstructed from the latent space are fed into the pre-trained StyleGAN generator. Experiments show that the algorithm can better construct the latent code of the accurate inverse mapping of the real image in the latent space, improve the quality of image reconstruction, and realize image semantic manipulation than the existing technology.
查看全文  查看/发表评论  下载PDF阅读器

你是第3259544访问者
版权所有《南京邮电大学学报(自然科学版)》编辑部
Tel:86-25-85866913 E-mail:xb@njupt.edu.cn
技术支持:本系统由北京勤云科技发展有限公司设计

欢迎访问《南京邮电大学学报(自然科学版)》编辑部!