https://ai.baidu.com/forum/topic/show/954092

学习ERNIE的输入部分

输入

一共有五个部分组成,每个部分之间用分号;隔开:

· token_ids:输入句子对的表示;

· sentence_type_ids:0或者1表示token属于哪一个句子;

· position_ids:绝对位置编码

· seg_labels:表示分词边界信息,0表示词首、1表示非词首、-1为占位符

· next_sentence_label:表示该句子对是否存在上下句的关系(0为无1为有)

mask有两种   word level   /  char level

在15%的基础上:

word level: 替换规则  80% mask  10% 替换  10%不替换

char level: 3% ~ 15% mask  1.5%~3% 随机字, 否则不替换

https://blog.csdn.net/Kaiyuan_sjtu/article/details/90265473

https://blog.csdn.net/Kaiyuan_sjtu/article/details/88709580

BERT源码分析 及实战

Cove,ELMo,GPT 等模型,构建了语句级的语义表示。

ERNIE 模型通过对词、实体等语义单元的掩码,使得模型学习完整概念的语义表示。相较于 BERT 学习原始语言信号,ERNIE 直接对先验语义知识单元进行建模,增强了模型语义表示能力。

https://www.jiqizhixin.com/articles/2019-03-16-3

最新文章

  1. 23种设计模式--单例模式-Singleton
  2. SQLServer存储过程事务用法
  3. Caffe源码解析4: Data_layer
  4. iOS 随记
  5. Scrum Meeting 3-20151203
  6. 在安装SqlServer2008时,有一项安装程序支持规则,为什么重新启动计算机那一项总是失败
  7. Android自动接听&挂断电话(包含怎么应对4.1以上版本的权限检
  8. JVM启动参数小结
  9. SDUT1586 计算组合数(组合数)
  10. 【.Net】文件并发(日志处理)--队列--Redis+Log4Net
  11. Android 从硬件到应用程序:一步一步爬上去 5 -- 在Frameworks蒂姆层硬件服务
  12. CentOS7 安装Hadoop集群环境
  13. xml学习_上篇
  14. 201521123097《Java程序设计》第一周学习总结
  15. LAMP的搭建
  16. Ubuntu18.04环境下melodic安装gmapping
  17. ssm框架中文请求乱码get
  18. 手机与PC的影音相互播放(DLNA/UPNP)
  19. git异常
  20. Exp6

热门文章

  1. 和PHP相关的Linux命令
  2. [Linux]安装kali虚拟机后忘记root密码
  3. ie8中使用ajax总是进入error解决办法
  4. Nginx 499的问题
  5. 如何让spark sql写mysql的时候支持update操作
  6. Zookeeper系列(十一)zookeeper的Leader选举详解(核心之一)
  7. centos7下面改变亮度
  8. 20175227张雪莹 2018-2019-2 《Java程序设计》第十周学习总结
  9. spring boot通过自定义注解和AOP拦截指定的请求
  10. substring(x)和substring(x,y)的用法