UNIT对话系统(杂记)
单轮对话指标:
召回率=机器人能回答的问题数/问题总数
准确率=机器人正确回答的问题数/问题总数
问题解决率=机器成功解决的问题数/问题总数
多轮对话指标:
任务完成率=成功结束的多轮会话数/多轮会话总数
格里斯准则:
质量准则:只说确认的真实的内容
数量准则:所说的话需要满足交流所需要的信息量,但不应该超出交流所需的信息量
相关法则:只说和主题相关的内容
态度准则:即说话需清晰明了,避免模棱两可
UNIT专业术语
BOT:
一个BOT对应一个特定场景下独立的对话系统,用来满足特定场景下的对话理解与交互需求。通常按行业垂类划分。
技能:
某一方向的对话能力,分为自定义技能和系统技能。
- 自定义技能:完全由用户配置
- 系统技能:UNIT平台预置的通用能力,支持开发者后期干预。
技能下包含对话意图与问答意图,即BOT拥有的技能既可以解析用户对话的对话意图,也可以实现简单的FAQ问答。
意图:
在一个对话任务中BOT要理解的用户目的。
意图分为对话意图和问答意图。问答意图用于圈定某一范围或主题的问答对。
词槽:
满足用户对话意图的关键信息或限定条件,可以理解为用户需要提供的筛选条件。词槽一定程度上影响系统对“【动作】”这个对话意图的执行。
词典:属于词槽的所有词汇组成词典。
对话样本:
用来给对话系统做示范,教它在用户说的具体句子里,该如何理解对话意图,哪个词是重要信息,对应词槽是什么。
对话模板:
用来给对话系统按具体语法、句式做出示范,教他在某一特定语法、句式中,该如何理解对话意图,哪个词是重要信息,对应词槽是什么。
对话模板也可以使用多条对话模板组成对话模板组,实现按片段去匹配用户query,实现更强的对话意图泛化匹配能力,提高模板对用户query的召回率。
特征词:
约束某条对话模板的匹配范围,提供一定限度的泛化能力。
活用特征词机制可以事半功倍的提高对话模板的精度和覆盖度。
特征词词典:开发者需自行导入词典,用于系统识别特征词。
问答对:
- 问题与答案的组合,称之为问答对。
- 问答对支持一对一,一对多,多对一,多对多。
- 当某个问题中包含多个答案,答案随机呈现。
问答集:
- 问答集是承载问答对的容器,与技能中问答意图的定义一一对应
- 支持批量将问答内容导入问答集和在线编辑
训练模型:
把BOT下所有的配置、标注的对话样本、对话模板等打包提交给UNIT平台来训练对话理解模型,训练的时长跟训练的对话样本量、对话模板量有关系,量越多训练时间越长。训练完成后沙河环境中的BOT会自动加载并生效模型,一般几分钟。
沙盒环境:
沙盒环境是UNIT平台提供开发者创建BOT、训练优化BOT模型的环境。
每个BOT都配有一个沙盒环境,将训练好的BOT模型生效到沙盒环境后,就可以进行效果验证了,同时可接入到您自己的业务系统中使用。
可以生成多个模型版本,但只能选择一个放到沙盒环境中。
生产环境:
生产环境是UNIT平台在百度云上为开发者提供的可定制的稳定的对话服务环境。
知识图谱:
知识图谱其实就是语义网,描述真实世界中存在的各种实体或概念。它是知识的结构化表示,通常我们用一张巨大的由点和边组成的图来可视化表现知识图谱:点代表实体或概念,用全局唯一确定ID来标识,称为标识符,点包含属性,称为值对(AVP),用来刻画实体的内在特性,边代表实体间的关系,用来连接两个实体。
情感分析:
情感分析是指为会话赋予情感值,可根据情感值的正负将情感倾向分为正面情感、中立情感和负面情感。
评测情感分析的指标主要为情感分类的准确率及负情感的召回率。
最新文章
- 第三次个人作业—“K米”评测
- 自己瞎捣腾的Win7下Linux安装之路-----理论篇
- Java面试题问与答——编译时与运行时
- ConfigParser.MissingSectionHeaderError: File contains no section headers.
- JavaScript知识架构学习路径(一)- 变量篇
- Timer 实现2秒4秒连环炸
- 第十五章 调试及安全性(In .net4.5) 之 管理程序集
- leetcode面试准备:Add and Search Word - Data structure design
- linux 下查看网速的方法 (不需要安装任何软件)
- 追踪CM_CONTROLCHANGE消息的产生和执行过程,可以较好的领会VCL的思想(就是到处通知,但耦合性很弱)
- zoj1537- Playing with a Calculator
- 数字信号处理专题(3)——FFT运算初探
- 微信小程序出现 Expecting 'STRING','NUMBER','NULL','TRUE','FALSE','{','[', got INVALID
- Displaylink安卓驱动
- Delphi Format 格式化数字
- OpenCV入门(1)- 简介
- CocoaPods:说点关于它的
- 13条Android手机必备技巧 让玩机更有趣
- fragment 事务回滚 ---动态创建fragment
- django 实用工具dj-database-url 快速配置数据库
热门文章
- 解决MySQL登录密码正确却提示错误-1045的方法
- Download Blackarch Linux
- Java中的线程Thread方法之---stop()
- 听说“辣鸡小隔膜”出V1.3了?
- Python查看对象属性的方法
- NX二次开发-UFUN获取一个图层类别的tag UF_LAYER_ask_category_tag
- NX二次开发-删除功能区工具栏UF_UI_remove_ribbon
- string反向找位置,分割字符串(只取文件夹路径)
- scrapy-redis分布式爬取tencent社招信息
- 剑指offer——35二叉树的后序遍历