Hu S, Yu T, Guo C, et al. A New Defense Against Adversarial Images: Turning a Weakness into a Strength[C]. neural information processing systems, 2019: 1633-1644.

@article{hu2019a,

title={A New Defense Against Adversarial Images: Turning a Weakness into a Strength},

author={Hu, Shengyuan and Yu, Tao and Guo, Chuan and Chao, Weilun and Weinberger, Kilian Q},

pages={1633--1644},

year={2019}}

代码.

本文介绍了一种检测是否为adversarial sample的defense.

主要内容

准则1

一般的CNN网络, 抗干扰(随机噪声)的能力是很强的, 这说明, 数据分布应当是如下图一样, \(x\)(其类别为\(A\)) 的周围的点大部分类别仍为\(A\), 落入\(B,C,D\)需要一些更强的干扰(如gradient-based adversaries).



这启发了作者, 采样\(\epsilon \sim \mathcal{N}(0, \sigma^2I)\), 比较

\[\Delta = \| h(\mathbf{x}) - h(\mathbf{x}+\epsilon)\|_1,
\]

其中\(h(\cdot)\)为网络, 其输出为概率向量, 显然\(\Delta\)越大, 说明\(x\)对随机噪声的抗干扰能力不强, 说明\(x\)越有可能是adversarial sample.

准则2

同样如上图, 可以发现, 普通的样本往往落在分类边界周围, 所以利用adversaries 可以很容易(表现为迭代次数少)就能将其转移到另外的类别区域中去, 相反的, adversarial samples往往落在分类区域内部, 所以如果我们将adversarial samples移动到别的区域是不容易的(表现为需要更多的迭代次数).

所以, 假设将\(x\)移动到别的区域内的最少迭代次数为\(K\), \(K\)越大越有可能是adversarial samples. 由于攻击分为untarget, target所以, 所以作者也将准则2细分为C2(t/u)

总策略

有了\((\Delta,K_t,K_u)\), 当其中任何一个大于(分别)\((t_{C1}, t_{C2t},t_{C2u})\)时, 我们就认为\(x\)是一个adversarial sample, 其中\((t_{C1}, t_{C2t},t_{C2u})\)是认为设置的阈值.

注: 这俩个直觉还是挺有趣的, 只是感觉很难实用, 毕竟这些指标不仅是依赖于网络本身, 对干净数据也是一个挑战.

最新文章

  1. ThinkPad W520 在 Windows Server 2012 / R2 中安装驱动
  2. aspjpeg组件在2008R2下“ActiveX 部件不能创建对象”
  3. 技术随笔 查找速度最快的Google IP
  4. Apache开启expires响应头,优化缓存
  5. 正则RegEXp
  6. iTextSharp
  7. RAC(ReactiveCocoa)使用方法(二)
  8. codevs 2964 公共素数因数
  9. 如何从GitHub下载csv文件
  10. Java课后作业之石家庄地铁系统PSP表格20190403
  11. NandFlash和iNand
  12. ES6+转ES5
  13. angularJS $http $q $promise
  14. Java中的引用:强引用、软引用、弱引用、幻象引用(虚引用)
  15. jQuery 实战读书笔记之第六章:事件本质
  16. winform webbrowser禁用网页target=blank
  17. hihocoder 1174 [BFS /拓扑排序判断是否有环]
  18. 学习 Promise,掌握未来世界 JS 异步编程基础
  19. 从navicat for mysql导出数据库语句时应该加上的两条语句
  20. 51Nod 1007 正整数分组 -简单DP

热门文章

  1. 15. Linux提取RPM包文件(cpio命令)详解
  2. 容器之分类与各种测试(三)——list部分用法
  3. maven常用Java配置
  4. Oracle带输入输出参数的存储过程
  5. entfrm-boot开发平台功能介绍【entfrm开源模块化无代码开发平台】
  6. 【Linux】【Commands】文件管理工具
  7. Jenkins备份
  8. libevent 资源链接
  9. MQTT协议 - arduino ESP32 通过精灵一号 MQTT Broker 进行通讯的代码详解
  10. 【web】BUUCTF-web刷题记录