今天终于想明白了分层softmax的作用:

哈夫曼树的作用是什么??用平均最小的长度编码!编码是为了解码成信息!

神经概率语言模型:有映射层,隐藏层,输出层,假设隐藏层是300维,输出层是和单词的数量相等的,因为传统Softmax的原因,比如有10000的词,那么参数就是300*10000=3000000 300万。。每次更新更300万的参数,速度可想而知。

刚开始我想把它变成树,每个非叶子节点的300维,非叶子节点的个数为叶子节点的个数-1=9999,300*9999=2999700,并没有减少参数,但是,每次更新的参数确是极大减少了,平均为logN=100  100*300=30000

所以层次的作用在于加速和快速寻找词。

最新文章

  1. 【开源】玩的就是开源 - DevFw
  2. 关于php cgi的配置
  3. BZOJ 4544: 椭圆上的整点
  4. thrift 安装介绍
  5. Hadoop 相关链接
  6. 使用JS创建表格以及隔行换色(包括隔N行换色)
  7. Java 下实现锁无关数据结构--转载
  8. CentOS 6.4 64位 源码编译hadoop 2.2.0
  9. ArcGIS Engine DEM拉伸渲染
  10. TypeError: document.getELementById is not a function
  11. [iOS]C语言技术视频-05-程序循环结构(do{}while();)
  12. session熟知
  13. 用存储过程向数据库添加大量数据【mysql】
  14. 【数学建模】MATLAB语法
  15. Python 实现 动态规划 /斐波那契数列
  16. 不是说记住rm -rf的教训就够了
  17. Entity Framework DbSet<T>之Include方法与IQueryable<T>扩展方法Include的使用
  18. 8-1 Stacks of Flapjacks UVA120
  19. A start job is running for /etc/rc.d/rc.local ... ... no limit
  20. Routing Manager for WCF4 z

热门文章

  1. Ciso三层交换 上vlan间互通, 端口映射到vlan
  2. ipcs查看消息队列命令
  3. PHPstorm支持YAF框架代码自动提示
  4. thinkPHP模型before_insert新增前 before_update更新前 before_write写入前 区别
  5. MySQL中的SQL的常见优化策略
  6. unittest之一框架、suite
  7. 快速幂(Fast_Power)
  8. 使用curl访问https
  9. 关于mysql-5.7.13-winx64服务无法启动的解决方法
  10. 网速监控-nload