Natural Language Processing with Python

Chapter  6.2

 import nltk
from nltk.corpus import nps_chat as nchat def dialogue_act_features(post):
features={}
for word in nltk.word_tokenize(post):
features['contains(%s)' % word.lower()] = True
return features def test_dialogue_act_types():
posts=nchat.xml_posts()[:10000]
featuresets = [(dialogue_act_features(post.text),post.get('class'))
for post in posts]
size=int(len(featuresets)*0.1)
train_set, test_set = featuresets[size:],featuresets[:size]
classifier = nltk.NaiveBayesClassifier.train(train_set)
print nltk.classify.accuracy(classifier,test_set)
classifier.show_most_informative_features(5)

运行结果:

0.668
Most Informative Features
contains(hi) = True Greet : System = 408.2 : 1.0
contains(>) = True Other : System = 384.6 : 1.0
contains(empty) = True Other : System = 339.4 : 1.0
contains(part) = True System : Statem = 302.0 : 1.0
contains(no) = True nAnswe : System = 262.3 : 1.0

最新文章

  1. [Q&A] MySQL Error 1050(42S01): Table already exist
  2. 中国UTM分区
  3. ActionLink()与jquery更好地结合建造MVC网页:
  4. DOCTYPE、指定语言、字符集
  5. 深入分析C++引用
  6. 详解SpringMVC请求的时候是如何找到正确的Controller
  7. XML 字符串解析
  8. 从 vCenter Server 使用的数据库中清除旧数据 (2075138)(转)
  9. 生成表结构数据库文档sql语句
  10. 删除TFS中的项目
  11. C# 类&结构体&枚举
  12. 详解webpack中的hash、chunkhash、contenthash区别
  13. Linux模拟网络延迟、丢包等
  14. hdu5302 构造
  15. After reading a picture than out a picture
  16. 获取Oracle数据库awr报告方法
  17. linux下lz4解压缩遇到的那些事儿
  18. Ocelot 新手上路
  19. JS 开发者必须知道的十个 ES6 新特性
  20. scala基础入门

热门文章

  1. UVA 1193 区间相关(greedy)
  2. 转:loadrunner关联及web_reg_save_param方法浅析
  3. HDU 2672 god is a girl
  4. Chapter 1 First Sight——22
  5. thinkphp整合系列之rbac的升级版auth权限管理系统demo
  6. 利用htmlunit登陆带验证码图片的网站
  7. 解决:无法将“Add-Migration”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。请检查名称的拼写,如果包括路径,请确保路径正确,然后再试一次
  8. elasticsearch 配置说明
  9. C#入门经典(1)
  10. 转 BAT CMD 批处理文件脚本总结(中文)