python——jieba分词过程
2024-10-16 00:56:38
import jieba
"""函数2:分词函数"""
def fenci(training_data):
"""-------------------------------------------------------
seg_list = jieba.cut("他来到上海交通大学", cut_all=True)
print("【全模式】:" + "/ ".join(seg_list))
他/ 来到/ 上海交通大学
----------------------------------------------------------"""
seg_list = jieba.cut(training_data) # 默认是精确模式
training_ci = " ".join(seg_list) # 空字符串中join加入分词后的词
training_ci = training_ci.split() # 以空格符作为分界线进行分割,保存为list
return training_ci
training_data="他来到上海交通大学"
training_ci=fenci(training_data)
print("training_ci1",training_ci)
training_ci 他 来到 上海交通大学
training_ci ['他', '来到', '上海交通大学']
最新文章
- [LeetCode] Unique Substrings in Wraparound String 封装字符串中的独特子字符串
- 检测文件是否有BOM 头,并删除BOM头(php)
- linux sysnc
- 【网络流24题】No.1 搭配飞行员(飞行员配对方案问题)
- [课程分享]IT软件项目管理(企业项目甘特如是评价、维护管理、文档管理、风险管理、人力资源管理)
- node.js的npm安装
- ZOJ 1204 一个集合能组成多少个等式
- python基础(常用内容)
- Exp1 PC平台逆向破解 20165235 祁瑛
- android H5支付 网络环境未能通过安全验证,请稍后再试
- DRF 商城项目 - 日志处理
- Three.js基础探寻一
- springboot JPA
- 给新创建的用户 赋予所有的权利 *.* 查看权限 删除用户 ---------DCL用户权限管理篇
- css实战——第一天
- uiview封装的基本动画
- 通过cmd命令安装、卸载、启动和停止Windows Service(InstallUtil.exe)
- volatile 和锁的内存语义
- 面向对象设计原则三:里氏替换原则(LSP)
- Android实战技巧之三十八:Handler使用中可能引发的内存泄漏
热门文章
- MySQL数据库事务各隔离级别加锁情况--read committed &;&; MVCC
- zookeeper的读写流程
- android 版本号大小比较
- WPF 引用 ttf文件
- SAS 日期格式显示年月的format
- Spring boot 的application.properties 全局配置
- eclipse修改android项目的apk包名类名
- MySql查询问题select from
- 数据库中id为自增
- Python全栈开发记录_第八篇(模块收尾工作 json &; pickle &; shelve &; xml)