python读入中文文本编码错误

python读入中文txt文本:

#coding:utf-8

def readFile():
fp = open('emotion_dict//neg//neg_all_dict.txt','r')
list = []
for line in fp:
list.append(line)
fp.close()
print(list)
readFile()

但是有时候会出现错误提示:

UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 10: illegal multibyte sequence

此时,需要对代码做一个小的调整,就可以读入中文,即以中文二进制'rb'读入txt,然后转换为'utf-8',具体代码如下:

#coding:utf-8

def readFile():
fp = open('emotion_dict//neg//neg_all_dict.txt','rb')
list = []
for line in fp.readlines():
line = line.strip()
line = line.decode('utf-8')
list.append(line)
fp.close()
print(list)
readFile()






最新文章

  1. vi
  2. eclipse-搭建maven的war项目集合spring注解方式
  3. Redis介绍及常用命令
  4. 4位或者5位led数码显示,485通信modbus,支持任意小数点写入,工业标准设置,可和plc,dcs,组态完美对接,支持定制修改
  5. [置顶] C++为什么是C++而不是++C
  6. 纯CSS实现各类气球泡泡对话框效果
  7. Educational Codeforces Round 27 补题
  8. 机器学习技法:11 Gradient Boosted Decision Tree
  9. ROS_Kinetic_29 kamtoa simulation学习与示例分析(一)
  10. Fleck For Web Socket
  11. Mysql 通用知识 2019-03-27
  12. JavaScript(六):错误处理机制
  13. Linux 目录栈及目录切换
  14. 如何安全的在不同工程间安全地迁移asset数据?三种方法
  15. spring init method destroy method
  16. php里获取第一个中文首字母并排序
  17. Spark2 Dataset多维度统计cube与rollup
  18. Scrapy爬取人人网
  19. CentOS7.4安装Java8
  20. 算法练习--- DP 求解最长上升子序列(LIS)

热门文章

  1. Elasticsearch: Join数据类型
  2. frps服务端与nginx可共用443端口
  3. 密码学奇妙之旅、03 HMAC单向散列消息认证码、Golang代码
  4. PyCharm安装PyQt5及其工具(Qt Designer、PyUIC、PyRcc)详细教程
  5. printf-库函数重定向、重载
  6. 提高工作效率的神器:基于前端表格实现Chrome Excel扩展插件
  7. 小程序返回上一级页面背景音乐报错 setBackgroundAudioState:fail title is nil!;
  8. nginx 通过IP访问项目
  9. 基本的Dos命令 在控制台如何进入某一个文件或者进入不同的盘符
  10. Vscode设置标签页多行显示