关于我们

最新公告

05-16

09-21

08-22

07-22

05-15

07-19

版权信息：
杂志名称：《价值工程》
主管单位：河北省科学技术协会
主办单位：河北省技术经济管理现代化研究会
国际刊号：1006-4311
国内刊号：13-1085/N
邮发代号：18-2
责任编辑：张崇
咨询电话：18132119945
投稿邮箱：vezzs02@163.com

精彩阅读

生成对抗网络在计算机视觉领域中的应用研究

Application Research of Generation Confrontation Network in the
Field of Computer Vision

高伟① GAO Wei；郭永峰② GUO Yong-feng；徐德衡③ XU De-heng
（①榆林市榆神煤炭榆树湾煤矿有限公司，榆林 719000；②榆林高新区第二小学，榆林 719000；③榆林学院，榆林 719000）
（①Yulin City Yushen Coal Yushuwan Coal Mine Co.，Ltd.，Yulin 719000，China；
②Yulin High-tech Zone Second Primary School，Yulin 719000，China；③Yulin University，Yulin 719000，China）

摘要：生成对抗网络在计算机视觉领域中有着十分广泛的应用，通过生成对抗网络，可以实现生成高品质图像、图像风格迁移、图像与文字交换、图像修复等众多方面的发挥。因此本文就生成对抗网络在计算机视觉领域中的应用展开分析和探究。
Abstract: The generation confrontation networks has a wide range of applications in the field of computer vision. By generation confrontation networks, it is possible to generate high-quality images, image style migration, image and text exchange, image restoration and many other aspects. Therefore, this paper analyzes and explores the application of generation confrontation networks in the field of computer vision.
关键词：生成对抗网络；计算机；视觉领域
Key words: generation confrontation network；computer；visual field
中图分类号：TP391 文献标识码：A 文章编号：1006-4311（2019）22-0253-02

0 引言
生成对抗网络是一种以生成学习模型为核心的新技术，这一技术在提出后就成为电子计算机技术中视觉领域的重点研发方向。而这一技术在计算机视觉领域中也得到了十分广泛的应用。
1 生成对抗网络及计算机视觉的概述
1.1 生成对抗网络的概念
随着对生成对抗网络的不断发展，例如图像处理、针对图像的风格进行迁移以及根据图像内容进行搜索等都成为当前网络计算机技术研究的重点内容[1]。在生成对抗网络中可以建立对目标图像形成数据集，进而在数据不足的情况下进行图像分析，在深度学习的领域中有着十分关键的作用。此外，生成对抗网络在图像翻译以及图像文件与文字之间相互转换、场景模拟生成等项目中也有重要的意义。
1.2 计算机视觉的概念
计算机视觉是通过计算机以及相关器材进行模拟操作，将计算机作为一种视觉设备，让其可以像生物一样以视觉的角度观察和分析现实世界，具有极高的环境适应能力。在计算机视觉中区分计算机是否可以真正的观察到现实世界主要通过图灵测试进行判断。这种技术可以分辨出计算机是否创造出一个与现实世界中一样的事物，通过图灵测试可以有效的区分出计算机创造的是真实的影像还是虚拟的影像。
2 生成对抗网络的研究
2.1 生成对抗网络的结构研究
在生成对抗网络中主要分为两种结构，即判断模型以及生成模型。这两种模型从根本上来讲都是一种函数，可以通过神经网络技术来完成。其基本结构框架如图1所示。
■
2.2 生成对抗网络的优点和不足
生成对抗网络在当前的研发中已经在众多领域中被广泛的应用，这些不同领域的应用对于生成对抗网络都有着不同的侧重点。在最初的生成对抗网络中，很少有人会重视先对提出的假设进行检验，在实验中没有对数据提出假设内容，因此在最初的生成对抗网络中可以进行任何形式的分布，最终形成一种无限制的建模技术，可以模拟所以的分布[2]。此外，生成对抗网络在设计上要求十分简单，因此可以在不形成函数模型的情况下是生成模型以及判断模型正常工作。这种技术打破传统的计算机智能计算法，在逻辑上不用人脑的思维去限制计算机的计算，而是在计算机之间进行计算。在拥有足够的数据训练下可以真正的学习到真实世界的规则。
但是生成对抗网络也存在着一定的不足之处。在实际运用过程中生成对抗网络的自由训练会导致自身的稳定性能以及收敛性大大降低，因此在操作时经常会发生模型崩塌的情况，导致训练无法正常进行。而在最初的生成对抗网络中也存在训练难度大、生成模型与判断模型之间出现损失导致无法正常完成训练。而形成的新样品内容过于单一、缺少样品的多样性。这些问题都对生成对抗网络的发展和应用产生不利影响。
3 生成对抗网络在计算机视觉领域中的应用
生成对抗网络在计算机视觉中的应用有着十分重要的意义，从图像生成一直到后期的众多应用，由于生成对抗网络在对抗效果上不断自我进步，在形成样本的过程中逐渐超过传统的技术方法。
3.1 生成高品质图像文件
生成对抗网络在计算机视觉领域中的应用最初就是生成图像以及建立模型，包括监督学习以及无监督学习这两种形式，生成对抗网络都可以实现模拟真实的数据进行分布。在生成高品质的图像应用中，人们一直都不断探索试图找到更加接近现实的图像数据，当前在这一领域中已经有很多成功的研发案例。例如DCGAN就是生成对抗网络在生成图像领域中较为成功的新技术。在这一技术中通过对建立的模型进行有效约束，进而达到提高训练能力的效果，进一步的增加生成对抗网络的稳定性能，当前已经成为生成对抗网络生成图像的质量标准[3]。此外，DCGAN的生成模型具有矢量加减计算的能力，也形成了这一领域研发的新方向，即在生成图像的过程中可以通过对特殊过滤技术进行输出特定图像，而不用存储数据中的图像记忆进行组合。在一般的图像数据集中包括的数据图像数量十分巨大，有的数据集甚至在千万的级别，而这些数据图像的分辨率普遍较低，在这种情况下数据集的训练种类足够，但是其中生成的图片却清晰度偏低，因此提高数据集中图像的清晰度已经成为当前生成图像技术的研究重点。
3.2 风格迁移应用
在生成对抗网络对计算机视觉进行应用的过程中，风格迁移是最有趣的应用领域，这一技术主要是将图像的风格转换到另一种风格上。例如pix2pix就是一种可以实现一对一进行图像风格迁移的生成对抗网络模型。在这一模型应用技术中，是通过两个数据集之间进行搜索，比如在数据集一中是需要迁移的图像轮廓图，在数据集二中是相对应的图像，将一个数据集中的数据作为条件输入到以CGAN为核心的模型中，而另一个数据集中的图像将作为输入设计，进而生成目标，再通过损失函数对其中的误差进行分析计算，经过训练就可以在提供一张图像的情况下形成另一风格的图像。此外，在这一技术中为了达到更加真实的图像效果，还可以进行进一步的图像优化处理。在风格迁移过程中通过优化可以通过卷积池操作保证图像的像素排列内容不变。
而循环一致生成对抗网络是对pix2pix技术的一次创新突破，在pix2pix技术中只能使用成对的图像进行风格迁移，但是在循环一致技术中却打破了这一限制，由于这一模型的约束性比其他模型更强，因此也会有一定的不良影响。例如在风格进行迁移时如果数据集之间的差距较大，生成的风格将会受到一定的影响[4]。
3.3 图像与文字交换应用
在生成对抗网络技术中，还存在将文字转换成图像的模型。生成对抗网络在经过数据训练之后可以形成更加真实的分布，例如在经过人脸面部数据集的训练之后，可以生成接近真实的人脸图像。但是这些图像的生成训练都是建立在图像训练上，通过对图像的某些特点分布进行再次生成。但是将文字转换生成图像则是另一个有创造性的模型，这种图像生成远比单纯形成图像更困难。这需要模型对文字的意义有一定深度的理解。在生成对抗网络技术中，提出通过深层卷识体系以及生成对抗网络的框架结构，在文字与图像之间建立转换联系，进而将回视觉图像通过文字转变成像素。在这一技术中，通过生成对抗网络在高斯噪声位置加入一个文本概念，将二者作为模型输入，再经过模型的数据训练学习，形成文本内容所想要的图像。而在判断模型中，将会把生成模型形成的图像以及真实图像、文字描述等输入到判断模型中，然后通过判断模型生成较为真实的图像。
根据文字转换成图像的方式十分困难，而且其中的限制较多。但是通过图像进而生成相应的文字则相对简单。通过数据训练学习，模型可以对图像进行简单的描述，但是想要让模型像人一样对图像进行详细描述也是文字图像转换技术研究的重点。在这一技术中可以通过半监督形式的段落文字生成方法，通过对部分语言进行推理和分析进而形成一整段的文字描述。
3.4 图像修复应用
当前生成对抗网络在人脸识别技术中已经有了很成熟的应用，在我国很多公共场所都已经安装这一技术，通过人脸识别可以有效的在人群中找到特定查找的人。但是在同一图像中进行多个人脸识别则还存在一定的困难。因此需要在生成对抗网络中通过图像修复技术达到这一目的。当前人们通过一种双路径生成对抗网络技术，对图像的整体结构以及内容进行整合，在形成真实度较高图像同时保留原有图像的特征。通过在不同角度、位置取得图像可以合成人脸的正面图像，再将合成的图像与真实的图像一同送入判断模型中进行分析[5]。
3.5 生成对抗网络的其他应用
生成对抗网络在计算机视觉领域中还存在其他方面的应用，例如可以模拟无监督的学习方法、视频预测以及合成3D图像等，生成对抗网络在计算机回视觉中的应用将会随着技术的进步而更加广泛。
4 结束语
综上所述，生成对抗网络作为一种先进的生成模型，可以在计算机视觉领域中有着十分广泛的应用。当前生成对抗网络已经在生成高品质图像、图像风格迁移、图像与文字交换、图像修复等方面有着相对成熟的研究成果，而随着生成对抗网络技术的日趋成熟，将会在计算机视觉领域中有着更广阔的发展空间。
参考文献：
[1]许哲豪，陈玮.基于生成对抗网络的图片风格迁移[J].软件导刊，2018，17（6）：207-209，212，封4. DOI:10.11907/rjdk.172830.
[2]袁书伟.生成式对抗网络模型综述[J].电脑迷，2018（24）：209，211.
[3]张卫，马丽，黄金.基于生成式对抗网络的人脸识别开发[J].电子世界，2017（20）：164-165.
[4]曹仰杰，贾丽丽，陈永霞，等.生成式对抗网络及其计算机视觉应用研究综述[J].中国图象图形学报，2018，23（10）：1433-1449.
[5]黄鹤，王长虎.从生成对抗网络到更自动化的人工智能[J].中国计算机学会通讯，2017，13（9）：40-44.

社址：石家庄市槐安西路88号卓达玫瑰园物业楼 050091 电话：18132119945 微信：15132496582

投稿邮箱：vezzs02@163.com

价值工程杂志社

备案号：冀ICP备19020820号-1

24小时热线: 18132119945