哈工大LTP语言分析:分词、词性标注、句法分析等
2024-09-29 14:53:40
1. LTP介绍和安装
LTP语言云官网 在线演示 | 语言云(语言技术平台云 LTP-Cloud)
安装LTP的python接口包
$ sudo pip install pyltp
模型文件下载
2. 使用LTP的python接口进行语言分析
#!/usr/bin/env python
# coding=utf-8 import sys
reload(sys)
sys.setdefaultencoding('utf8')
import os
from pyltp import Segmentor, Postagger, Parser class LtpLanguageAnalysis(object):
def __init__(self, model_dir="/home/xxx/ltp-3.4.0/ltp_data/"):
self.segmentor = Segmentor()
self.segmentor.load(os.path.join(model_dir, "cws.model"))
self.postagger = Postagger()
self.postagger.load(os.path.join(model_dir, "pos.model"))
self.parser = Parser()
self.parser.load(os.path.join(model_dir, "parser.model")) def analyze(self, text):
# 分词
words = self.segmentor.segment(text)
print '\t'.join(words) # 词性标注
postags = self.postagger.postag(words)
print '\t'.join(postags) # 句法分析
arcs = self.parser.parse(words, postags)
print "\t".join("%d:%s" % (arc.head, arc.relation) for arc in arcs) def release_model(self):
# 释放模型
self.segmentor.release()
self.postagger.release()
self.parser.release() if __name__ == '__main__':
ltp = LtpLanguageAnalysis()
ltp.analyze("元芳你怎么看")
ltp.release_model()
输出结果:
元芳 你 怎么 看
nh r r v
4:SBV 4:SBV 4:ADV 0:HED
通过LTP的在线演示demo可以看到对应的图结构如下:
(参考:pyltp 0.2.0 文档 )
最新文章
- css选择器优先级全解析
- css position:absolute 如何居中对齐
- Java中的HashSet和TreeSet
- C#入门篇6-9:字符串操作 不值一提的函数【不看也行】
- C++中的static关键字(转)
- python发布与共享
- SharePoint 2013 &;quot;通知我&;quot;简单的功能
- VMware装ubuntu 进不去图形界面, 卡在Installing VMware Tools
- Servlet 笔记-过滤器
- 使用 requirejs 打包 jQuery 插件 datetimepicker 的问题记录
- Python查找指定文件
- CentOS7 安装Perl
- 转载-增删改查sql语句语法
- samba config
- Node.js 常用 API
- DLL Dynamic-Link Library Search Order
- 每日英语:Stalled Project Shows Why China's Economy Is Wobbling
- Django学习笔记---第一天
- 【智能算法】迭代局部搜索(Iterated Local Search, ILS)详解
- Spring学习--引用其他Bean , 内部Bean