论文链接:http://www.zijunwei.org/papers/cvpr18-photo-composition.pdf

代码及数据集链接:https://www3.cs.stonybrook.edu/~cvl/projects/wei2018goods/VPN_CVPR2018s.html

本文贡献

1.建立了一个大型数据集——Comparative Photo Composition (CPC) dataset;

2.提出了一个新颖的知识转移框架来训练基于锚框的实时VPN模型(view proposal model);

首先使用Siamese架构在视图对上训练一个视图评估模型,然后我们将这个模型作为一个老师来对各种图像上的候选锚盒进行评分,这些教师评分将视VPN训练为学生模型,以输出相同的锚框评分排名。为了训练学生,我们提出了平均两两误差(MPSE)损失。

VPN模型:以图像作为输入,并输出与预定义锚框列表相对应的分数。

训练View Proposal Networks

本文提出一个知识转移框架,在教师模型VEN(View Evaluation Net)的监督下将View Proposal Net(VPN)训练为学生模型。 VEN,它需要一个视图作为输入,并预测组成的分数,因此这可以直接在我们的CPC数据集训练。 为了转移知识,我们在给定图像的锚点框上运行VEN,然后使用预测的分数、新颖的平均成对平方误差(MPSE)损失训练VPN。

VPN:SSD+MultiBox

骨干网络是基于SSD(Conv9之后被截)的,在骨干网的顶部,我们添加了一个卷积层、一个平均池化层和一个全连接层,输出N个分数,对应于N个预定义的锚盒。我们通过在不同比例和长宽比的标准化图像上密集滑动来预先定义锚盒集,结果得到一组N = 895个预定义锚盒。

VEN:Siamese结构

我们采用Siamese结构训练VEN,Siamese结构是由两个共享权重的VEN组成,每个输出输入图像对中对应图像的分数。本文VEN是基于VGG16(在最后一个最大池化层之后截断)的,其中包含两个新的全连接(FC)层和一个新的输出层。由于我们的模型只输出一个排名分数,而不是1000多个类的概率分布,所以我们将FC层的通道分别减少到1024和512。

最新文章

  1. ArrayList,Vector,LinkedList
  2. 在linux上配置并创建JavaFX项目
  3. 实现Launcher默认壁纸、选择壁纸定制化功能
  4. loopback 04
  5. epoll实现压测工具
  6. android SDK启动的错误
  7. HTML JSOgN to string
  8. ACM俱乐部 字符串
  9. microsoft的罗马帝国——浪潮之巅
  10. 由点击页面其它地方隐藏div所想到的jQuery的delegate
  11. 后端推送给app等发生错误如何处理
  12. IS动态左侧菜单-01
  13. StringBuilder的实现与技巧(转)
  14. C语言博客作业--一二维数组。
  15. Java四种引用类型
  16. Spring Boot应用总结更新
  17. BugPhobia开发篇章:Beta阶段第VII次Scrum Meeting
  18. windows10的普通用户使用Task Scheduler的问题
  19. Nexus构建
  20. [android] android下创建一个sqlite数据库

热门文章

  1. python smtp发邮件报错“[Errno -2] Name or service not known”的解决
  2. shell 的正则表达式 grep
  3. 【LeetCode】Stack
  4. Dubbox服务的提供方配置
  5. idea 右键没有class文件的问题,,
  6. uva658 dijkstra+状态压缩
  7. Windows添加右键新增.md文件
  8. python基础和编程库
  9. leetcode-第14周双周赛-1272-删除区间
  10. Clickhouse集群部署