nltk词性标注
2024-08-30 11:52:40
将词汇按它们的词性(parts-of-speech,POS)分类以及相应的标注它们的过程被称为词
性标注(part-of-speech tagging, POS tagging)或干脆简称标注。词性也称为词类或词汇范
畴。用于特定任务的标记的集合被称为一个标记集。
使用词性标注器进行英文的词性标注。
1. 打开cmd,输入python,进入python编译环境。
import nltk text =nltk.word_tokenize("And now for something completely different")
nltk.pos_tag(text)
一开始报错:
那么多,看都不想看。不想看也不行,慢慢看呗,答案肯定就在这里面。
看了下,还真找到了,
按照步骤来,使用下载器获取资源。
然后再运行开始的代码,结果如下:
[('And', 'CC'), ('now', 'RB'), ('for', 'IN'), ('something', 'NN'), ('completely', 'RB'), ('different', 'JJ'), ('.', '.')]
在这里我们看到and 是CC,并列连词;now 和completely 是RB,副词;for 是IN,介
词;something 是NN,名词;different 是JJ,形容词。
2. 另一个例子,这次包括一些同形同音异义词:
最新文章
- Android消息机制入门
- CodeBlocks配置pthread环境
- 用AXIS2发布WebService的方法
- Debugging a Parallel Application
- Android Studio工程目录介绍
- php插入转义与查找转义
- vi命令笔记
- asp.net web api实现图片点击式图片验证码
- javascript:将URL的参数列表解析为一个对象
- 并发库应用之六 &; 有条件阻塞Condition应用
- 【English】二、It作为代词,可以代指什么
- SQLite的文件锁、并发与pager---(SQLite学习手册(锁和并发控制))
- python之tips(三)--为什么Python有相同的不可变对象id不同?
- JavaServer Faces (JSF) with Spring
- 廖雪峰Java1-3流程控制-9break、continue
- 修改windows默认的远程连接端口
- conan-transit服上的库列表
- golang channel的使用
- windows下的C++ socket服务器(4)
- EChart处理三维数据做图表、多维legend图例处理