论文地址:https://arxiv.org/abs/1906.00817

代码:https://github.com/valeoai/ZS3

一、内容

Step 0:首先使用数据集(完全不包含 Unseen Classes 的图片)训练 DeepLabv3+ 模型,得到的模型可以对只含有 Seen Classes 的图片进行分类,去掉训练好的 DeepLabv3+ 的最后一层分类层,将其变成一个特征提取器。将所有 Classes 输入到 w2c 模型,得到每个Class 对应的向量,将此向量连接到 ground-truth 中每个像素上,即每个像素都有其对应的类的向量。

Step 1:使用数据集(完全不包含 Unseen Classes 的图片)输入到 DeepLabv3+ 模型,得到特征图,根据 ground-truth 上的 Class 筛选出不同类别的特征,将每个类的特征作为 Label,对应类的 w2c 输出的向量作为输入,训练 GMMN 模型。

Step 2:使用完整数据集 (包含 Seen 和 Unseen Classes 的图片)输入到 DeepLabv3+ 模型,如果不包含 Unseen Classes,那么直接拿出特征图去训练最终的分类器,如果包含,则根据图片的 ground-truth 对应的类的向量一一生成特征,将不同类特征组合到一起,再去训练最终的分类器。

二、理解

1. 代码中将 Step 1 和 2 和在了一起,为了便于理解,把 Step 1 和 2 分开解释。

2. Step 2 中使用了两次包含 Unseen Classes 的图像和其 ground-truth。

  • 在逐个对类的词向量生成特征时,用到了 ground-truth,根据 ground-truth 知道了类的总数、每个类的位置、以及对应的词向量。
  • 在最终训练分类器时,也用到了含有 Unseen Class 的图像的 ground-truth。
  • 也可以直接忽略 DeepLab 生成的特征图,直接根据 Seen 和 Unseen 标签随机生成图片,利用类的词向量通过 GMMN 生成特征,结合生成的图片的 Label 去训练最终分类器。

3. w2c 和 GMMN 是文章的关键,w2c 建立了一个从词语到向量的联系,GMMN 建立了一个从词向量到特征图上的视觉特征的联系,比如,使用 Unseen Class 为子弹,Seen Class 中包括弹匣,其他都是些不相干的类,自然子弹和弹匣在词向量中的联系比较起来相对紧密,从而子弹通过 GMMN 生成的特征也更与弹匣类似,通过最终分类器的训练,也就更容易能分辨出子弹。

最新文章

  1. KOTLIN开发语言文档(官方文档) -- 2.基本概念
  2. 单核 -512M内存-2000并发正常使用
  3. 【Infobright】infobright数据导入导出测试
  4. (原)android4.2以后获取应用程序和缓存大小的方法(源码有改变)
  5. Atitit 发帖机系列(7) 词法分析的方法attilax大总结)
  6. cdh完美集成kafka
  7. NOI2018准备Day3
  8. JSP、HTML标签
  9. MySQL sql语句总结
  10. rails bug
  11. flex 实时更新的一些方法总结
  12. What Influences Method Call Performance in Java?--reference
  13. Robot Framework 自动化测试 Selenium2Library 库 用法
  14. C#数组--(Array类的属性和方法)
  15. 线程的同步(协调)synchronized
  16. JAVA (1)–第一个GUI程序 添加标题 关闭窗口 屏幕位置 导入图标
  17. 在Windows XP系统下架设FTP服务器需要5个步骤。
  18. python学习之老男孩python全栈第九期_day014知识点总结
  19. DistinctBy
  20. js中的控制结构for-in语句

热门文章

  1. MongoDB_数据模型&数据类型(四)
  2. 细谈 == 和 equals 的具体区别 【包括equals源码分析】
  3. java 访问 太平洋网ip接口,解决前端js 跨域访问失败问题
  4. java mapreduce实现网站PV分析
  5. 一站式搭建 GitHub Pages 博客 (一)
  6. 以太 ip tcp udp 三次握手的理解
  7. 【刷题-LeetCode】123 Best Time to Buy and Sell Stock III
  8. SSM项目使用拦截器实现登录验证功能
  9. QT之鼠标事件
  10. Go 面向对象三大特性