基于GAN的草图生成服装图像方法研究

作者: 朱英琳 邢里程 吴爽

基于GAN的草图生成服装图像方法研究0

摘要:随着时尚行业的不断发展和数字技术的进步,利用计算机将草图转换为目标图像的需求日益增长。在草图生成服装图像中,如何生成复杂纹理和逼真的效果一直是一个重要的挑战。文章构建了用于草图生成服装图像的数据集,并基于生成对抗网络模型实现了从草图到服装图像的转换。实验结果表明,该方法能够有效地从草图生成服装图像,生成的图像具有清晰的纹理和较高的逼真度。

关键词:草图生成服装图像;生成对抗网络;图像生成

中图分类号:TP3   文献标识码:A

文章编号:1009-3044(2025)07-0047-03

开放科学(资源服务) 标识码(OSID)

0 引言

在人工智能的推动下,时尚产业正经历着数字化转型,服装图像生成在推动行业数字化进程中发挥着重要作用。传统的时尚设计和生产模式正面临挑战,消费者对个性化、多样化时尚产品的需求日益增长[1] 。在数据和硬件资源的支持下,基于深度学习的人工智能技术飞速发展,并在服装产业中得到广泛应用,例如设计和创意辅助、个性化推荐、趋势预测、虚拟试衣、服装生成、品质检测和智能客服等,有效提升了时尚产业的效率、个性化服务和创新能力[2] 。服装生成近年来引起了广泛关注,因为它有潜力彻底改变时尚产业,传统的服装设计和生产方法耗时、昂贵,且受限于人类的创造力[3] 。通过利用深度学习的技术,可以自动化和增强服装设计过程,实现新颖、个性化的服装。本文旨在研究基于生成对抗网络(Generative Adversarial Network,GAN)的草图生成服装图像的方法,可以为时装设计师提供灵感,以提高服装设计过程的效率和创造力。

1 相关工作

图像生成作为计算机视觉领域的重要分支,近年来随着深度学习的研究和发展,涌现出大量的基于深度学习的图像生成方法。目前,图像生成领域主要存在三大模型:深度置信网络 (Deep Belief Network, DBN)、变分自编码器(Variational Autoencoder, VAE)和生成对抗网络(Generative Adversarial Network, GAN)[4] 。生成对抗网络(GAN)是由Goodfellow等人于2014 年提出的一种用于解决图像生成问题的模型[5] 。GAN模型由生成器和判别器组成,可以通过对抗训练的方式学习生成逼真的服装图像。近年来,许多国内外研究者通过改进GAN的结构和训练策略,使其在服装生成任务中取得了显著成果。部分研究通过引入条件GAN (Conditional GAN, CGAN),将用户的偏好信息融入生成过程中,实现了个性化的服装设计。例如,Isola等人于2017年提出了一种基于CGAN架构的有监督图像风格转换模型pix2pix,该模型能够实现图像到图像的转换,并通过添加条件信息来指导图像生成[6] 。同年,Zhu 等人提出了一种基于无监督学习的图像风格转换模型 CycleGAN[7] 。CycleGAN 由两个生成器和两个判别器组成,能够生成更加逼真的图像。2020年Karras等人提出StyleGAN,该技术将图像生成推向了新的高度,能够生成高质量、逼真的图像[8] 。除了GAN模型外,变分自编码器(VAE)也是一种常用的图像生成模型。VAE可以学习服装图像的潜在表示,并通过对潜在空间进行插值和操作来生成新的服装图像。研究人员通过设计合适的潜在空间和优化策略,不断提高VAE在服装生成方面的效果。

除上述基本模型外,研究人员还探索了许多其他技术和方法来改进服装生成的质量和多样性。例如,部分研究致力于生成高分辨率、细粒度的服装细节,并通过引入更复杂的网络结构和损失函数来实现。还有一些研究关注于将服装生成与虚拟试穿和时尚推荐系统相结合,以提供个性化的时尚体验。

总而言之,国内外研究者在服装生成领域做出了令人瞩目的努力,并取得了丰硕的成果。他们不断探索新的深度学习模型和方法,致力于解决服装设计和生产中的挑战。这些研究对推动时尚产业的创新和发展具有重要意义。然而,该领域仍面临一些挑战,例如生成高分辨率、细粒度的服装细节,以及在图像处理过程中保持服装结构的完整性等。

2 服装草图数据集的设计与构建

针对现有服装数据集中服装草图的缺乏以及设计师手绘图的版权问题,本文采用一种基于边缘检测算法的方法构建服装草图数据集。本文首先利用爬虫技术从电商平台爬取服装图片,然后对获取的图片进行预处理,最后利用边缘检测算法生成草图数据集。

本文利用Scrapy爬虫框架,从某电商平台爬取以“连衣裙”为主题的图片,共爬取3 089张图片,经过数据清洗,去除重复图片和非正面图,最终获得1 542张图片,如图1所示。

为了生成草图数据集,本文采用Canny边缘检测算法提取图像边缘,然后对提取后的图像进行灰度反转,最终生成服装草图,结果如图2所示。

Canny算法是一种经典的边缘检测算法,它通过多个步骤来识别图像中的边缘,包括高斯滤波、计算梯度、非极大值抑制和双阈值处理[9] 。在提取出边缘图像的基础上进行图像的灰度反转,通过将边缘图像的灰度值进行反转,黑色边缘将变为白色,白色背景将变为黑色。这样可以使得服装草图中的服装边缘呈现黑色,符合草图的特点,模拟真实的服装草图。最后将生成的草图数据集用于后续的服装生成模型的训练和测试。

将爬取到的真实原始图像与生成的草图进行配对,剔除生成图像质量较差的样本,最终筛选出1 001对图像。将所有图像尺寸调整为256×256像素,并按照8∶2的比例划分训练集和测试集,其中训练集包含801对图像,测试集包含200对图像,如表1所示。

3 基于GAN的草图生成服装图像

在草图生成真实图像的研究领域,已经涌现出许多相关研究工作。其中,经典的图像风格迁移模型pix2pix已成功实现了从草图到真实图像的转换。然而,pix2pix在处理特征简单的图像时效果较好,但在服装生成任务上表现不佳,生成的图像质量和纹理都不理想。为了验证这一结论,本文将pix2pix与CycleGAN进行对比实验。实验结果表明,CycleGAN模型能够更好地解决草图转换为逼真服装图像的问题。

CycleGAN模型由两个生成器和两个判别器组成,一个生成器用于将草图转换为服装图像,另一个生成器用于将服装图像转换回草图。两个判别器分别用于区分真实图像和生成图像,并提供对抗性训练的参数,如图3所示。

本文使用构建的服装草图数据集对CycleGAN模型进行训练。实验中,图像大小为256×256像素,批处理大小设置为1,未使用批归一化。在前100个epoch中,学习率设置为0.000 2,在随后的100个epoch中,学习率线性下降至0。实验结果如图4所示。从实验结果可以看出,与pix2pix相比,CycleGAN生成的

图像具有更清晰的纹理和线条,整体效果更佳。这表明,使用本文构建的草图数据集训练CycleGAN模型能够生成更加逼真、纹理清晰的服装图像。

4 结束语

本文探讨了基于草图生成真实服装图像的任务,并构建了服装草图数据集,使用CycleGAN模型进行图像转换。实验结果表明,该方法能够生成具有清晰纹理和较高逼真度的服装图像。与pix2pix等传统方法相比,CycleGAN在服装生成方面表现更优。本研究为时尚行业和服装设计领域提供了一种有效的图像生成解决方案,具有巨大的应用潜力。未来工作可以进一步改进和优化该方法,以提高生成图像的质量和多样性,推动该领域的发展。

参考文献:

[1] 熊媛园,侯金玥.AI设计带给现代服装设计行业的挑战与机遇[J].纺织报告,2023,42(9):47-49.

[2] 赵梦如.人工智能在服装款式设计领域的应用进展[J].纺织导报,2021(12):74-77.

[3] 吴丹.人工智能技术在服装制造中的应用[J].纺织报告,2021,40(10):35-36.

[4] 施倩,罗戎蕾.基于生成对抗网络的服装图像生成研究进展[J].现代纺织技术,2023,31(2):36-46.

[5] GOODFELLOW I J,POUGET-ABADIE J,MIRZA M,et al.Generative adversarial nets[C]//Proceedings of the 28th International Conference on Neural Information Processing Systems - Volume 2.December 8 - 13,2014,Montreal,Canada.ACM,2014:2672-2680.

[6] ISOLA P,ZHU J Y,ZHOU T H,et al.Image-to-image translation with conditional adversarial networks[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).July 21-26,2017.Honolulu,HI.IEEE,2017:1125-1134.

[7] ZHU J Y,PARK T,ISOLA P,et al.Unpaired image-to-image translation using cycle-consistent adversarial networks[C]//2017 IEEE International Conference on Computer Vision (ICCV).October 22-29,2017.Venice.IEEE,2017:2223-2232.

[8] KARRAS T,LAINE S,AITTALA M,et al.Analyzing and improving the image quality of stylegan[J].Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition,2020:8107-8116.

[9] 窦蕾萍,吴君钦.基于改进Canny算法的图像边缘检测[J].软件导刊,2023,22(8):216-220.

【通联编辑:朱宝贵】

经典小说推荐

杂志订阅