深度学习发展历史

感知机和逻辑回归很像,只是没有\(sigmoid\)激活函数。

深度学习训练的三个步骤

Step1:神经网络(Neural network)
Step2:模型评估(Goodness of function)
Step3:选择最优函数(Pick best function)

Step1:
完全连接前馈神经网络 Fully Connect Feedforward Network

概念:输入层、隐藏层、输出层、神经元
Deep = Many hidden layers
全连接:两层之间两两都有连接

层数很多,运算量大,用loop不合适,应该用矩阵计算,可以并行计算,用GPU去加速。

需要多少层,每层多少个神经元?尝试+直觉
结构可以自动确定吗?比如进化人工神经网络可以
自己设计?比如卷积神经网络CNN

Step2:
用交叉熵来度量Loss

Step3:
使用Gradient Descent多次迭代
在神经网络中计算损失最好的方法就是反向传播,我们可以用很多框架来进行计算损失,比如说TensorFlow,theano,Pytorch等等

思考:
为何要用多层?后续章节有介绍。

最新文章

  1. rsync同步
  2. POJ 3294 二分找超过一半字符串中存在的子串
  3. ORA-00030: User session ID does not exist.
  4. C# 多重overide
  5. json注意:
  6. 最长上升子序列[LIS]
  7. POJ 2503 Babelfish
  8. 李洪强漫谈iOS开发[C语言-018]-scanf函数
  9. jquery - ul li click 无响应
  10. 【POJ2761】【fhq treap】A Simple Problem with Integers
  11. CH Round #53 -密室
  12. php字符串常用处理函数(数组的拆分、查找替换)
  13. [TYVJ] P1027 木瓜地
  14. 关于android混淆文件project.properties和proguard-project.txt详解
  15. webpack的Hot Module Replacement运行机制
  16. 内核对象 windows操作系统
  17. iOS简单动画效果:闪烁、移动、旋转、路径、组合
  18. TensorFlow实战之实现自编码器过程
  19. python的测试
  20. GIT版本控制工具总结

热门文章

  1. vue简介,插值表达式,过滤器
  2. 生成HTML测试报告表格
  3. Codeforces_832
  4. java一些技术
  5. 数据库连接池 —— Druid的简单使用
  6. 从底层入手,解析字节码增强和Btrace应用
  7. TomCat控制台中文乱码及IDEA设置为UTF-8
  8. 由lwip的mbox中netbuf传递看指针的指针
  9. 动态获取bind dns日志IP脚本
  10. Go 1.14 中 Cleanup 方法简介