这个项目主要涉及到两个网络,其中卷积神经网络用来提取图片表达的情绪,提取出一个二维向量。

网络结构如图:

词向量采用预训练的glove模型,d=50,其他信息包括了图片的“空旷程度”、亮度、对比度等信息,用来更好地描述图片特征。

对于图中的卷积神经网络,需要讲解的地方是:卷积核是一个一维卷积核,每一层卷积层之后都连接了池化层,做的是最大值池化,每一层之间有固定的dropout层,最后输出的向量与我们预先设定的label进行计算,损失函数定义为

\[J(\theta)=-\sum_iy'_i\log(y_i)+\frac{\lambda}{2}\|\theta\|^2_F\]

式中使用了交叉熵和L2范数避免可能出现的过拟合,在实际训练中我们将会增减神经网络的层数,调整相应的超参数。

最后得到的向量我们在LSTM里进行输入。

最新文章

  1. EntityFramework与TransactionScope事务和并发控制
  2. Javascript中构造函数与new命令
  3. OC中的protocol
  4. OFFSET IN 使用举例
  5. 配置ogg异构oracle-mysql(2)源端配置
  6. codeforces A. Dima and Continuous Line 解题报告
  7. MAC 下用GCC编译报错:“Undefined symbols for architecture x86_64: ”
  8. Amazon MWS 上传数据 (二) 构造请求
  9. /export/App/zz/phantomjs-1.9.7-linux-x86_64/bin
  10. 生成唯一32位ID编码代码Java(GUID)
  11. sql-update语句多表级联更新
  12. 一条SQL搞定信息增益的计算
  13. PV和UV的简单记录
  14. .NET Core和Swagger 生成 Api 文档
  15. dpdk-18.11网卡多队列RSS设置
  16. eureka 学习
  17. selenium面试题总结
  18. HttpSenderUtil向指定 URL 发送POST方法的请求
  19. 使用组件构建Android应用程序
  20. seo标题关键字描述字数限制Title,keywords,description长度最长多长 ?

热门文章

  1. hdu4886 TIANKENG’s restaurant(Ⅱ) (trie树或者模拟进制)
  2. 使用gdb调试c程序莫名退出定位 exit 函数
  3. 7.15实习培训日志 java题解
  4. HDU - 1114 Piggy-Bank 完全背包(背包恰好装满)
  5. gitHub上传代码
  6. 记一次前端面试~终于拿到理想中的offer!
  7. ue4 改c++类名
  8. Android权限之三共享UID和签名
  9. 「BZOJ2127」happiness(最小割)
  10. [Swift]Xcode实际操作