第七讲_图像描述(图说)Image Captioning

  • 本章结构
  • 递归神经网络

  • 时序后向传播(BPTT)

朴素Vanilla-RNN

  • 基本模型
  • 用sigmoid存在严重的梯度消失

LSTM长短时记忆模型(97年提出)

  • 基本模型
  • 模型对比
  • LSTM数学模型
  • 控制门作用理解
  • LSTM结构图






  • LSTM变种:
  • Peephole
  • Coupled 忘记输入门

GRU门限递归单元(Gated Recurrent Unit)

  • 改进
  • LSTM和GRU比较

图像描述

  • 为图片生成描述语言

  • 具有多模态理解和推理;复合理解与推理等研究难点和挑战
  • 传统的分段处理策略
  • 新的点对点策略
  • 模型组成

Show and tell 模型

  • 概述

  • 具有attention机制模型

数据集

  • MSCOCO标注集

最新文章

  1. Scala:Java 项目中混入scala代码
  2. salesforce 零基础学习(四十九)自定义列表分页之使用Pagination实现分页效果 ※※※
  3. 将centos7打造成桌面系统
  4. PHP对象转数组||PHP数组转对象
  5. Android平板电脑开发— — —碎片
  6. PLSQL Developer调试 存储过程和触发器
  7. libcurl断点下载
  8. ios入门之c语言篇——基本函数——3——判断日期是一年的第几天
  9. 为什么要用BitSet
  10. 微博API怎么爬取其它未授权用户的微博/怎么爬取指定用户公布的微博
  11. 关于Adobe CC 系列软件反复弹出 Adobe 软件许可问题
  12. 【译】C++日志(Logging in C++)
  13. js算法初窥01(排序算法01-冒泡、选择、插入)
  14. Intellij Idea中如何debug本地maven项目
  15. [原创]Modelsim后仿真
  16. MongoDB学习记录(二) - MongoDB的"增查改删"操作之"增"
  17. 一直性hash解决扩容后的hash算法不用变
  18. 振兴中华|2013年蓝桥杯A组题解析第三题-fishers
  19. 《Linux内核分析》 第二节 操作系统是如何工作的
  20. 066——VUE中vue-router之rewrite模式下配置404页面

热门文章

  1. UVa 1452 递推 Jump
  2. web安全测试---跨站点脚本测试
  3. day04_03 题目判断三个数字中的最大值
  4. 九度oj 题目1348:数组中的逆序对
  5. 九度oj 题目1356:孩子们的游戏(圆圈中最后剩下的数)
  6. 【转】Building a RESTful Web Service
  7. Git的使用小结
  8. BZOJ-2829 信用卡凸包
  9. 337. House Robber III(包含I和II)
  10. ServletContext ActionContext ServletActionContext