目录

Samangouei P, Kabkab M, Chellappa R, et al. Defense-GAN: Protecting Classifiers Against Adversarial Attacks Using Generative Models.[J]. arXiv: Computer Vision and Pattern Recognition, 2018.

@article{samangouei2018defense-gan:,

title={Defense-GAN: Protecting Classifiers Against Adversarial Attacks Using Generative Models.},

author={Samangouei, Pouya and Kabkab, Maya and Chellappa, Rama},

journal={arXiv: Computer Vision and Pattern Recognition},

year={2018}}

本文介绍了一种针对对抗样本的defense方法, 主要是利用GAN训练的生成器, 将样本\(x\)投影到干净数据集上\(\hat{x}\).

主要内容

我们知道, GAN的损失函数到达最优时, \(p_{data}=p_G\), 又倘若对抗样本的分布是脱离于\(p_{data}\)的, 则如果我们能将\(x\)投影到真实数据的分布\(p_{data}\)(如果最优也就是\(p_G\)), 则我们不就能找到一个防御方法了吗?

对于每一个样本, 首先初始化\(R\)个随机种子\(z_0^{(1)}, \ldots, z_0^{(R)}\), 对每一个种子, 利用梯度下降(\(L\)步)以求最小化

\[\tag{DGAN}
\min \quad \|G(z)-x\|_2^2,
\]

其中\(G(z)\)为利用训练样本训练的生成器.

得到\(R\)个点\(z_*^{(1)},\ldots, z_*^{(R)}\), 设使得(DGAN)最小的为\(z^*\), 以及\(\hat{x} = G(z^*)\), 则\(\hat{x}\)就是我们要的, 样本\(x\)在普通样本数据中的投影. 将\(\hat{x}\)喂入网络, 判断其类别.

另外, 作者还在实验中说明, 可以直接用\(\|G(z^*)-x\|_2^2 \frac{<}{>} \theta\) 来判断是否是对抗样本, 并计算AUC指标, 结果不错.

注: 这个方法, 利用梯度方法更新的难处在于, \(x \rightarrow \hat{x}\)这一过程, 包含了\(L\)步的内循环, 如果直接反向传梯度会造成梯度爆炸或者消失.

最新文章

  1. 使用AIDL调用远程服务设置系统时间
  2. BZOJ4533 [BeiJing2014 WinterCamp] 数据
  3. Java排序算法——拓扑排序
  4. Hello Mybatis 01 第一个CRUD
  5. Ubuntu 13.10 安装 ia32-lib
  6. 自定义Spring event
  7. SCALA中类的继承
  8. MySQL字符集编码
  9. Python学习笔记——基础篇【第七周】———FTP作业(面向对象编程进阶 &amp; Socket编程基础)
  10. 图论中DFS与BFS的区别、用法、详解…
  11. repo 和git的用法
  12. pwnable.tw dubblesort
  13. Underscore.js 源码学习笔记(下)
  14. 安装composer Failed to decode zlib stream 问题解决方法
  15. yum安装常用工具命令
  16. vue2 切换路由时 页面滚动到顶部 用游览器返回时 记住上页的位置
  17. Android ListView滚动到指定的位置
  18. cocoapod Podfile use frameworks swift/oc混编 could not build module xxx
  19. android资讯类软件框架《IT蓝豹》
  20. 有关 Azure IaaS VM 磁盘以及托管和非托管高级磁盘的常见问题解答

热门文章

  1. A Child&#39;s History of England.34
  2. IDEA 使用rest client测试
  3. js和jquery之间的转换
  4. VectorCAST软件自动化测试方案
  5. Redis cluster 集群命令合集
  6. Declarative Pipeline 基础语法
  7. [BUUCTF]PWN——jarvisoj_tell_me_something
  8. [BUUCTF]PWN——[BJDCTF 2nd]r2t4
  9. Table.ReorderColumns移动…Reorder…(Power Query 之 M 语言)
  10. CF1057B DDoS 题解