

近年来,人工智能(AI)和深度学习模型发展迅速,变得容易获取。这使得人们,即使是没有专业知识的人,也可以用人工智能执行各种任务。在这些模型中,生成对抗网络(GANs)在生成与训练数据具有相同特征的新数据实例方面表现突出,使其在生成图像、音乐和文本方面特别有效。
GANs由两个神经网络组成,即从随机噪声开始创建新数据分布的生成器和检查生成的数据分布是“真实”(与训练数据匹配)还是“假”的判别器。随着训练的进行,生成器在生成真实分布方面有所改进,而鉴别器在识别生成的数据为假数据方面有所改进。
gan使用损失函数来测量假分布和真实分布之间的差异。然而,这种方法可能会导致梯度消失和不稳定学习等问题,直接影响稳定性和效率。尽管在改进gan方面取得了相当大的进展,包括结构修改和损失函数调整,但诸如梯度消失和模式崩溃等挑战,在这些挑战中,生成器产生的品种有限,继续限制了它们的适用性。
为了解决这些问题,由韩国中央大学电气与电子工程学院助理教授Minhyeok Lee领导的一组研究人员开发了一种新策略。“想象一下,教一位艺术家画风景画。一致的指导可能会导致它们产生类似的场景,这种现象在机器学习中被称为模式崩溃。为了防止这种情况,我们的PMF-GAN模型改进了鉴别器的能力,惩罚了产生过度相似输出的生成器,从而促进了多样性,”Lee博士解释说。
他们的研究结果发表在2024年10月的《应用软计算》杂志上。
PMF-GAN框架引入了两个关键的增强。首先,它采用核优化来改进鉴别器的能力,在解决模型崩溃和梯度消失问题方面具有显著的优势。核是将数据转换为更高维度空间的数学函数,即使在复杂数据中也更容易检测模式。鉴别器的输出通过核函数处理,产生核密度估计(KDE)。
其次,PMF-GAN将称为直方图变换的数学技术应用于KDE输出,从而能够对结果进行更直观的分析。在训练过程中,该模型将核直方图转换后的假分布和真实分布之间的差异最小化,这是一种称为PMF距离的度量。
特别是,这种方法允许使用各种数学距离函数和核函数。这种灵活性允许PMF-GAN适应不同的数据类型和学习目标。此外,PMF-GAN可以集成到现有的改进GAN架构中,以获得更好的性能。
在实验中,PMF-GAN在多个数据集的视觉质量和评估指标方面优于几个基线模型。对于Animal FacesHQ数据集,与传统的WGAN-GP模型相比,它显示了56.9%的初始分数和61.5%的起始距离(FID)分数的提高。
“PMF-GAN提供的灵活性和性能改进为在各种技术和数字领域生成合成数据开辟了新的可能性。在医疗保健中,它将导致更稳定和多样化的图像生成。它还可以为电影、视频游戏和虚拟现实体验提供更加逼真和多样化的计算机生成视觉效果。”
“随着人工智能生成的内容在我们的日常生活中变得越来越普遍,我们的方法提高了内容的质量和多样性,并将确保人工智能继续成为人类创造力和解决问题的宝贵工具。”
更多信息:Jangwon Seo等人,用核直方图变换和概率质量函数距离训练的稳定GAN模型,Applied Soft Computing(2024)。引文:研究人员开发了一种新的生成对抗网络模型,可以稳定训练和表现(2024年,10月16日),检索自https://techxplore.com/news/2024-10-generative-adversarial-networks-stabilizes.html。除为私人学习或研究目的而进行的任何公平交易外,未经书面许可,不得转载任何部分。内容仅供参考之用。