Identifying Dialogue Act Type
2024-08-28 15:39:23
Natural Language Processing with Python
Chapter 6.2
import nltk
from nltk.corpus import nps_chat as nchat def dialogue_act_features(post):
features={}
for word in nltk.word_tokenize(post):
features['contains(%s)' % word.lower()] = True
return features def test_dialogue_act_types():
posts=nchat.xml_posts()[:10000]
featuresets = [(dialogue_act_features(post.text),post.get('class'))
for post in posts]
size=int(len(featuresets)*0.1)
train_set, test_set = featuresets[size:],featuresets[:size]
classifier = nltk.NaiveBayesClassifier.train(train_set)
print nltk.classify.accuracy(classifier,test_set)
classifier.show_most_informative_features(5)
运行结果:
0.668
Most Informative Features
contains(hi) = True Greet : System = 408.2 : 1.0
contains(>) = True Other : System = 384.6 : 1.0
contains(empty) = True Other : System = 339.4 : 1.0
contains(part) = True System : Statem = 302.0 : 1.0
contains(no) = True nAnswe : System = 262.3 : 1.0
最新文章
- [Q&;A] MySQL Error 1050(42S01): Table already exist
- 中国UTM分区
- ActionLink()与jquery更好地结合建造MVC网页:
- DOCTYPE、指定语言、字符集
- 深入分析C++引用
- 详解SpringMVC请求的时候是如何找到正确的Controller
- XML 字符串解析
- 从 vCenter Server 使用的数据库中清除旧数据 (2075138)(转)
- 生成表结构数据库文档sql语句
- 删除TFS中的项目
- C# 类&;结构体&;枚举
- 详解webpack中的hash、chunkhash、contenthash区别
- Linux模拟网络延迟、丢包等
- hdu5302 构造
- After reading a picture than out a picture
- 获取Oracle数据库awr报告方法
- linux下lz4解压缩遇到的那些事儿
- Ocelot 新手上路
- JS 开发者必须知道的十个 ES6 新特性
- scala基础入门
热门文章
- UVA 1193 区间相关(greedy)
- 转:loadrunner关联及web_reg_save_param方法浅析
- HDU 2672 god is a girl
- Chapter 1 First Sight——22
- thinkphp整合系列之rbac的升级版auth权限管理系统demo
- 利用htmlunit登陆带验证码图片的网站
- 解决:无法将“Add-Migration”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。请检查名称的拼写,如果包括路径,请确保路径正确,然后再试一次
- elasticsearch 配置说明
- C#入门经典(1)
- 转 BAT CMD 批处理文件脚本总结(中文)