python笔记10-----便捷网络数据NLTK语料库
2024-08-31 07:00:38
1、NLTK的概念
NLTK:Natural language toolkit,是一套基于python的自然语言处理工具。
2、NLTK中集成了语料与模型等的包管理器,通过在python编辑器中执行。
import nltk
nltk.download()
便会弹出下面的包管理界面,在管理器中可以下载语料,预训练的模型等。
比如下载完语料库(比方说是gutenberg语料库),可以通过以下加载:
fileids()函数可以查看gutenberg中收录的图书,words函数可以方便地得到某本书中文字
最新文章
- 20155324王鸣宇对C语言课程回顾及对Java的展望
- go 数据类型转换
- JS之call/apply/bind
- Java正则表达式之语法规则
- Posix 信号量
- Ubuntu的默认root密码
- Oracle Text Slowly
- MyEclipse中Web项目的发布和运行
- WPF-22:WPF绘制五角星改进版(增加半个五角星的绘制)-修改bug
- 对于CocoaPods的简单理解,实践安装使用过程和常见问题
- springmvc 项目完整示例03 小结
- 固态+机械双硬盘分别安装Win10和Ubuntu16.04双系统
- JAVA主流日志梳理
- shell linux 环境下循环遍历文件夹下所有文件
- 【LOJ】#150. 挑战多项式
- HDU 3625 Examining the Rooms【第一类斯特灵数】
- eclipse项目版本控制忽略上传文件
- 【Leetcode】292. Nim游戏
- 层叠顺序与堆栈上下文、font-family字体定义顺序的
- 简单账本-用完即走的微信小程序