没有合适的资源?快使用搜索试试~ 我知道了~
资源详情
资源评论
资源推荐

AT-GAN:一个生成对抗网络中用于对抗迁
移的生成攻击模型
Xiaosen Wang, KunHe
School of Computer Science and Technology
Huazhong University of Science and Technology
Wuhan 430074, China
{xiaosen,brooklet60}@hust.edu.cn
Chuan Guo, Kilian Weinberger, John Hopcroft
Department of Computer Science, Cornell University
Ithaca 14853, USA
{cg563,kilian,jeh}@cornell.edu
摘要
目前的一些研究发现了深度神经网络对对抗样本的不稳健性,这些对于人类
来说难以察觉的对抗样本却能够轻易的欺骗深度神经网络 DNNs。现存的用于生
成对抗样本的方法主要是在原图像上加上一些轻量级扰动,所以其最终生成的对
抗样本也受到原正常样本的限制,即对抗样本与原正常样本间的矩阵范数会很小。
在本文中,我们提出一个名为 AT-GAN 的新攻击模型。AT-GAN 能够使用生成对
抗网络(GANs)由随机噪声直接生成对抗样本。其核心要义是对要攻击的目标
分类器迁移一个预训练的 GAN 来生成对抗样本。一旦建立的模型进行迁移并用
于攻击,AT-GAN 能够很有效的生成多样化的对抗样本。因而 AT-GAN 能够潜在
的加速在防御方面的对抗训练。我们在 MNIST 数字手写数据库上运用典型防御
方法并在灰箱和黑箱的环境下对 AT-GAN 进行了评估。经过大量的与现有的基
准攻击方法的对比显示 AT-GAN 能够达到更高的攻击成功率。

1 绪论
深度神经网络(DNNs)于近几年在计算机视觉的一些任务中展示出了极其
优异的性能(Krizhevsky 等人, 2012; He 等人, 2016)。然而,DNNs 却被发现容易
受到对抗样本的欺骗(Szegedy 等人, 2014)。根据鲁棒性和安全方面的含义,这
种用于产生对抗样本的方法叫做攻击。同时一般将对抗攻击分为有目标的攻击和
无目标的攻击等两类。有目标的攻击目的在于生成能够被归为特定类别的对抗样
本,而无目标的攻击的目标在于生成无法归类正确的对抗样本。诸如 Fast
Gradient Sign (FGSM) (Goodfellow 等人., 2015)和 Carlini-Wagner 攻击(C&W)
(Carlini and Wagner, 2017)等的各式算法(Yuan 等人., 2017)被提出,并用于生成
对抗样本。而对抗样本也可以用到训练中去来提高模型的鲁棒性,这也是被称为
对抗训练的流行且有效的防御手段(Goodfellow 等人., 2015; Kurakin 等人., 2017;
Song 等人, 2019)。
大多数的攻击算法(Goodfellow 等人, 2015; Carlini and Wagner, 2017)都是基
于梯度下降在输入端加上不可察觉的扰动来生成对抗样本,而这也意味着这样生
成的对抗样本受到原图像的限制。Xiao 等人(2018)提出训练一个把原正常图片
x
作为输入的生成器
G
来生成扰动
()Gx
,故
()x G x
就能够欺骗目标模型。然而他
们得到的结果仍然受到原始图像的限制。Song 等人(2018)提出一个利用目标分
类器的梯度下降搜索任意噪声矢量附近的噪声输入的方法,使得这样的输入可以
产生对抗样本。Song 等人(2018)称他们的方法的输出为不受限的对抗样本,因为
其输出不受到原正常图像的限制。然而,因为使用梯度下降在原始噪声的邻域内
寻找良好特性的噪声,故他们的输出仍受限于噪声输入。除此之外,他们的方法
涉及到对梯度下降进行数百次迭代,导致效率低下。

在本文中,我们提出了一种新的生成攻击模型 AT-GAN(在生成对抗网络上的
对抗迁移)。我们首先训练一个生成对抗网络(GANs) (Goodfellow 等人, 2014)然
后迁移标签以从随机噪声中生成对抗样本。注意到相较于 Song 等人(2018),我
们的输出真正不受限于输入。一旦我们的生成模型由生成正常图像迁移到生成对
抗图像,它能够直接由任意随机噪声输入直接产生不受限制的对抗样本,因而具
有更高的多样性。同时,我们的模型不依赖于梯度方法的迭代过程故生成过程非
常高效。
为了评估我们的攻击策略的有效性,我们尝试了几种模型从随机噪声中使用
AT-GAN 生成对抗样本,并将我们的模型与其他几种攻击方法在灰箱和黑箱攻击
中进行了比较。然后,我们应用典型的防御方法(Goodfellow 等人, 2015; Madry
等人, 2017; Tramèr 等人, 2018)来抵御这些生成的对抗样本。实验结果表明,由
AT-GAN 生成的对抗样本具有较高的攻击成功率。
我们主要的贡献如下:
与以往侧重于如何在原始图像中添加人为扰动的攻击方法不同,我们可
以由随机噪声生成不受限制的对抗实例。
与基于优化的攻击不同,我们训练了一个条件生成网络来直接生成对抗
样本,它不依赖于输入的梯度,使得基于梯度的防御更加困难,也提高
了生成过程的效率。
与少数使用 GAN 进行攻击的方法不同,我们生成的图像具有更高的多样
性,因为输出不受限于输入。
通过使用典型防御方法抵御对抗实例的大量实验表明,在灰箱和黑箱攻
击中 AT-GAN 比其他现存的对抗攻击方法可达到更高的攻击成功率。
剩余14页未读,继续阅读





























卅年枫
- 粉丝: 10
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 互联网教育培训PPT模板【ppt精品模板】.pptx
- 进程模拟调度算法课程设计.pptx
- 电力调度的自动化网络安全分析及实现.docx
- DIVCSS视频教程-DIVCSS开发实例实战DIVCSS网站首页制作.ppt
- 计算机网络设计试题及答案.doc
- 基于网络药理学探讨蝉翼藤治疗Ⅱ型糖尿病的潜在机制.docx
- PLC控制步进电机的运行.doc
- 单片机时钟课程设计.doc
- Oracle汽车供应商解决专业技术方案.doc
- (源码)基于Node.js的游戏盒子下载页.zip
- 算法与数据结构C语言版课后习题参考答案(机械工业出版社)1绪论习题详细答案.doc
- 基于HPLC法的对乙酰氨基酚片中有关物质含量的测定.docx
- 基于YOLOv5算法的智能安全驾驶监测系统.docx
- 数据库课程方案设计书学生考勤系统.doc
- MCS51单片机原理及应用实验评测报告.doc
- 2018届高三数学二轮复习-第一篇-专题突破-专题一-集合、常用逻辑用语、平面向量、复数、不等式、算法、推理.ppt
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈



安全验证
文档复制为VIP权益,开通VIP直接复制

评论0