5.3序列模型与注意力机制

觉得有用的话,欢迎一起讨论相互学习~Follow Me

3.1基础模型

[1] Sutskever I, Vinyals O, Le Q V. Sequence to Sequence Learning with Neural Networks[J]. 2014, 4:3104-3112.
[2] Cho K, Van Merrienboer B, Gulcehre C, et al. Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation[J]. Computer Science, 2014.

seq2seq

  • 示例 对于法语句子: Jane visite l'Afrique en septembre 翻译成英语为 : Jane is visiting Africa in September
  • 对于输入句子使用\(x^{<1>},x^{<2>},x^{<3>},x^{<4>},x^{<5>}\)来表示输入句子的单词,使用\(y^{<1>},y^{<2>},y^{<3>},y^{<4>},y^{<5>},y^{<6>}\)来表示输出句子的单词。
  • 首先建立 编码网络encoder network 它是一个RNN结构,RNN的子结构可以是GRU或者LSTM,每次向网络中输入一个单词,将输入序列接收完毕后,这个RNN会输出一个向量来代表这个输入序列。
  • 之后你可以建立一个 解码网络decoder network 它以编码网络的输出作为输入。 解码网络 可以被训练为每次输出一个翻译后的单词,一直到它输出序列的结尾或者句子结尾标记,解码网络工作结束。
  • 和介绍RNN时一样,解码网络 将前一个时间步的输出作为输入进行该时间步的预测。
  • 这个模型简单地使用一个编码网络对输入的法语句子进行编码,然后用一个解码网络来生成对应的英语翻译

[1] Mao J, Xu W, Yang Y, et al. Deep Captioning with Multimodal Recurrent Neural Networks (m-RNN)[J]. Eprint Arxiv, 2015.
[2] Vinyals O, Toshev A, Bengio S, et al. Show and tell: A neural image caption generator[C]// IEEE Conference on Computer Vision and Pattern Recognition. IEEE Computer Society, 2015:3156-3164.
[3] Karpathy A, Li F F. Deep visual-semantic alignments for generating image descriptions[C]// Computer Vision and Pattern Recognition. IEEE, 2015:3128-3137.

Image captioning 图片描述 image to Sequence model

  • 类似的结构也可以被用来做 图片描述(Image captioning) , 给出一张图片,他能自动地输出该图片的描述。

    A cat sitting on a chair
  1. 首先,使用CNN学习图片的一系列特征,并输出图片的编码。
  2. 去掉末端的softmax单元,可以得到一个4096维的向量来表示这张图片
  3. 接着可以把这个向量输入到RNN中,RNN通过每次生成一个单词的形式输出该图片的描述。事实证明,这种方法十分有效,特别是当输出的描述图片的句子不是特别长的时候

最新文章

  1. iOS开发:自定义控件实现手势解锁
  2. zz转码问题
  3. struts2:数据校验,通过Action中的validate()方法实现校验(续:多业务方法时的不同验证处理)
  4. placehold.it-在线图片生成器(转载)
  5. Can&#39;t find bundle for base name ClientMessages, locale zh_CN
  6. angularJS 指令一
  7. ECMAScript 5/6/7兼容性速查表
  8. 《数据通信与网络》笔记--虚电路网络:帧中继和ATM
  9. 我的Python成长之路---第一天---Python基础(5)---2015年12月26日(雾霾)
  10. android浏览器 源码共享
  11. SQL总结 连表查询
  12. UML关系实现、泛化,依赖、组合
  13. 月球美容计划之最小生成树(MST)
  14. hibernate中复合主键的使用
  15. HSSFWorkbook 与 XSSFWorkbook
  16. 初探 hexo博客
  17. [LeetCode]Find Bottom Left Tree Value
  18. BZOJ4245 ONTAK2015 OR-XOR 【位运算+贪心】*
  19. awk查找
  20. 修改IntelliJ IDEA字体

热门文章

  1. AppCan 之初体验
  2. 2017年软件工程第八次作业-每周PSP例行报告
  3. 2018软工实践—Alpha冲刺(2)
  4. Java数学函数Math类
  5. 【转】MySQL数据类型
  6. Java 调用 google 翻译
  7. Hibernate学习--hibernate延迟加载原理-动态代理(阿里电面)
  8. ssh &amp; sftp &amp; MacOS
  9. 第101天:CSS3中transform-style和perspective
  10. 【Quartz.NET】Quartz.NET 入门