python读入中文文本编码错误
2024-10-20 01:25:27
python读入中文文本编码错误
python读入中文txt文本:
#coding:utf-8
def readFile():
fp = open('emotion_dict//neg//neg_all_dict.txt','r')
list = []
for line in fp:
list.append(line)
fp.close()
print(list)
readFile()
但是有时候会出现错误提示:
UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 10: illegal multibyte sequence
此时,需要对代码做一个小的调整,就可以读入中文,即以中文二进制'rb'读入txt,然后转换为'utf-8',具体代码如下:
#coding:utf-8
def readFile():
fp = open('emotion_dict//neg//neg_all_dict.txt','rb')
list = []
for line in fp.readlines():
line = line.strip()
line = line.decode('utf-8')
list.append(line)
fp.close()
print(list)
readFile()
最新文章
- vi
- eclipse-搭建maven的war项目集合spring注解方式
- Redis介绍及常用命令
- 4位或者5位led数码显示,485通信modbus,支持任意小数点写入,工业标准设置,可和plc,dcs,组态完美对接,支持定制修改
- [置顶] C++为什么是C++而不是++C
- 纯CSS实现各类气球泡泡对话框效果
- Educational Codeforces Round 27 补题
- 机器学习技法:11 Gradient Boosted Decision Tree
- ROS_Kinetic_29 kamtoa simulation学习与示例分析(一)
- Fleck For Web Socket
- Mysql 通用知识 2019-03-27
- JavaScript(六):错误处理机制
- Linux 目录栈及目录切换
- 如何安全的在不同工程间安全地迁移asset数据?三种方法
- spring init method destroy method
- php里获取第一个中文首字母并排序
- Spark2 Dataset多维度统计cube与rollup
- Scrapy爬取人人网
- CentOS7.4安装Java8
- 算法练习--- DP 求解最长上升子序列(LIS)
热门文章
- Elasticsearch: Join数据类型
- frps服务端与nginx可共用443端口
- 密码学奇妙之旅、03 HMAC单向散列消息认证码、Golang代码
- PyCharm安装PyQt5及其工具(Qt Designer、PyUIC、PyRcc)详细教程
- printf-库函数重定向、重载
- 提高工作效率的神器:基于前端表格实现Chrome Excel扩展插件
- 小程序返回上一级页面背景音乐报错 setBackgroundAudioState:fail title is nil!;
- nginx 通过IP访问项目
- 基本的Dos命令 在控制台如何进入某一个文件或者进入不同的盘符
- Vscode设置标签页多行显示