NeuralCoref: python的共指消解工具教程
2024-10-20 18:51:48
转载地址
https://blog.csdn.net/blmoistawinde/article/details/81782971
共指消解
首先简要地说说共指消解是什么,有什么用处。假设机器正在阅读一个这样的文本:
克劳德·莫奈是印象派代表人物和创始人之一。
他最重要的风格是改变了阴影和轮廓线的画法。
如果机器想要从这段话中了解到关于莫奈风格的知识,它首先必须知道,第二句话中的“他”指的就是莫奈。弄清代词的指代就是共指消解中的一个典型任务。
关于共指消解,更详细的概念可以参照:
https://blog.csdn.net/qjc937044867/article/details/51694547
下面直接引出解决这个问题的一个开源工具——NeuralCoref。
NeuralCoref
Github官网:https://github.com/huggingface/neuralcoref
NeuralCoref是使用时下先进神经网络技术完成指代消解任务的一个工具。它不是一个独立的python库, 而是另一个高速强大的python自然语言处理库——spaCy的一个拓展包,因此,要使用这个工具首先要安装spaCy:
pip install spacy
然后,再安装NeuralCoref支持的几个模型,下面的例子中,我会使用面向英语的小模型,安装方法如下:
pip install https://github.com/huggingface/neuralcoref-models/releases/download/en_coref_sm-3.0.0/en_coref_sm-3.0.0.tar.gz
如果需要更大的词汇量和准确率,把链接中的sm改成md/lg就可以下载对应的中模型和大模型。
基本用法
下面用jupyter notebook展示其基本用法:
下一篇文章里,我会再尝试共指消解的一个有趣应用:
NeuralCoref: 用指代消解来做一个“能多轮对话的问答对话机器人”
最新文章
- centos 更换软件源
- zoom在css中的作用
- 国内如何使用gem?
- VS安装部署
- C#中的那些全局异常捕获
- Sql server存储过程中常见游标循环用法
- jsmooth 中文乱码
- jquery循环table中tbody的tr中input:text,将值进行拼接传入控制器并返回状态和描述
- java星座、年龄、日期等
- JTree demo
- Linux 安装Xampp以后,Apache服务器无法启动,以及启动后,连接sql数据库遇到的问题的解决方法
- vue之v-on
- PredicateBuilder类(linq多条件组合查询)
- winform学习目录
- WebService协议
- Jupyter Notebook修改目标文件
- http的请求流程
- SVN 的搭建及使用(二)VisualSVN Server建立版本库,以及VisualSVN和TortoiseSVN的使用
- April 4 2017 Week 14 Tuesday
- 牛客小白月赛1 F	三视图 【循环】