1、NLTK的概念

NLTK:Natural language toolkit,是一套基于python的自然语言处理工具。

2、NLTK中集成了语料与模型等的包管理器,通过在python编辑器中执行。

import nltk

nltk.download()

便会弹出下面的包管理界面,在管理器中可以下载语料,预训练的模型等。

比如下载完语料库(比方说是gutenberg语料库),可以通过以下加载:

fileids()函数可以查看gutenberg中收录的图书,words函数可以方便地得到某本书中文字

最新文章

  1. 20155324王鸣宇对C语言课程回顾及对Java的展望
  2. go 数据类型转换
  3. JS之call/apply/bind
  4. Java正则表达式之语法规则
  5. Posix 信号量
  6. Ubuntu的默认root密码
  7. Oracle Text Slowly
  8. MyEclipse中Web项目的发布和运行
  9. WPF-22:WPF绘制五角星改进版(增加半个五角星的绘制)-修改bug
  10. 对于CocoaPods的简单理解,实践安装使用过程和常见问题
  11. springmvc 项目完整示例03 小结
  12. 固态+机械双硬盘分别安装Win10和Ubuntu16.04双系统
  13. JAVA主流日志梳理
  14. shell linux 环境下循环遍历文件夹下所有文件
  15. 【LOJ】#150. 挑战多项式
  16. HDU 3625 Examining the Rooms【第一类斯特灵数】
  17. eclipse项目版本控制忽略上传文件
  18. 【Leetcode】292. Nim游戏
  19. 层叠顺序与堆栈上下文、font-family字体定义顺序的
  20. 简单账本-用完即走的微信小程序

热门文章

  1. 洛谷 P2712 摄像头
  2. poj 1734 floyd求最小环,可得到环上的每个点
  3. CodeForces - 274A - k-Multiple Free Set
  4. 草草搞了个SERVLET的注册登陆功能
  5. ExpressionTreeVisualizer
  6. asp.net--owin的知识点
  7. redis安装配置-linux
  8. 用 Python 理解 Web 并发模型
  9. binlog
  10. Dozer--第三方复制工具,哎哟,还不错!