第七讲_图像描述(图说)Image Captioning
2024-08-30 05:37:41
第七讲_图像描述(图说)Image Captioning
- 本章结构
递归神经网络
时序后向传播(BPTT)
朴素Vanilla-RNN
- 基本模型
- 用sigmoid存在严重的梯度消失
LSTM长短时记忆模型(97年提出)
- 基本模型
- 模型对比
- LSTM数学模型
- 控制门作用理解
LSTM结构图
- LSTM变种:
- Peephole
Coupled 忘记输入门
GRU门限递归单元(Gated Recurrent Unit)
- 改进
- LSTM和GRU比较
图像描述
为图片生成描述语言
- 具有多模态理解和推理;复合理解与推理等研究难点和挑战
- 传统的分段处理策略
- 新的点对点策略
模型组成
Show and tell 模型
概述
具有attention机制模型
数据集
- MSCOCO标注集
最新文章
- Scala:Java 项目中混入scala代码
- salesforce 零基础学习(四十九)自定义列表分页之使用Pagination实现分页效果 ※※※
- 将centos7打造成桌面系统
- PHP对象转数组||PHP数组转对象
- Android平板电脑开发— — —碎片
- PLSQL Developer调试 存储过程和触发器
- libcurl断点下载
- ios入门之c语言篇——基本函数——3——判断日期是一年的第几天
- 为什么要用BitSet
- 微博API怎么爬取其它未授权用户的微博/怎么爬取指定用户公布的微博
- 关于Adobe CC 系列软件反复弹出 Adobe 软件许可问题
- 【译】C++日志(Logging in C++)
- js算法初窥01(排序算法01-冒泡、选择、插入)
- Intellij Idea中如何debug本地maven项目
- [原创]Modelsim后仿真
- MongoDB学习记录(二) - MongoDB的";增查改删";操作之";增";
- 一直性hash解决扩容后的hash算法不用变
- 振兴中华|2013年蓝桥杯A组题解析第三题-fishers
- 《Linux内核分析》 第二节 操作系统是如何工作的
- 066——VUE中vue-router之rewrite模式下配置404页面