1.        SCA-CNN: Spatial and Channel-wise Attention in Convolutional Networks for Image Captioning(2017 CVPR)

主要研究方向:大多数现有的基于注意力的图像字幕模型只考虑了空间特征,本文是对同一层的feature map(特征图)加入了权重考虑。

2.        Knowing When to Look: Adaptive Attention via A Visual Sentinel for Image Captioning(2017 CVPR)

主要研究内容: 更多的关注实体词之间的连词,比如“of”等。

解决思路:在框架中加入一个哨兵门,能够决定在生成实体词的时候应该注意图片,在生成连接词的时候,应该关注于语言。

Most methods force visual attention to be active for every generated word. However, the decoder likely requires little to no visual information from the image to predict non-visual words such as “the” and “of”.

最新文章

  1. SmallPtAMP: C++ AMP implementation of SmallPt / SmallPtGPU
  2. HTML5.dcloud.io-stream-app
  3. Hive内部表外部表转化分析(装)
  4. ajax中返回json数据有"
  5. Fedora install chrome
  6. Linux下Mysql主从复制(Master-Slave)与读写分离(Amoeba)实践
  7. 最全ASCLL码
  8. VLC命令行的应用
  9. AppClassLoader和WebAppClasssLoader的坑
  10. 15个易遗忘的java知识点
  11. PHP----------linux下安装opcache.
  12. BZOJ2561最小生成树——最小割
  13. Python网络爬虫第二弹《http和https协议》
  14. Qt5+VS2010的安装及使用
  15. 真实的人类第三季/全集Humans迅雷下载
  16. Elasticsearch学习之快速入门案例
  17. div 自动全屏高度
  18. Apache Tez 了解
  19. 什么是web service (转)
  20. Abp的AspNetZero5.0版本无法使用ctrl+f5调式

热门文章

  1. cs5642-v3各配置文件测试图片对比
  2. Koa中间件(middleware)级联原理
  3. iOS Charts 折线图框架的基本使用
  4. webpack学习2.3webpack核心概念
  5. Node6-1单元测试mocha
  6. 《Java基础知识》Java集合(Map)
  7. Python基础知识第八篇(集合)
  8. 使用Power BI API 向流数据集推送实时数据并在仪表板可视化
  9. 小白的springboot之路(九)、集成MongoDB
  10. 守护线程,需要通过调用线程方法:setDaemon(boolean on)来进行设置