一、 

 在爬虫抓取网页信息时常需要将类似"\u4eba\u751f\u82e6\u77ed\uff0cpy\u662f\u5cb8"转换为中文,实际上这是unicode的中文编码。可用以下方法转换:

1、

 >>> s = u'\u4eba\u751f\u82e6\u77ed\uff0cpy\u662f\u5cb8'
>>> print s
人生苦短,py是岸

2、

 >>> s = r'\u4eba\u751f\u82e6\u77ed\uff0cpy\u662f\u5cb8'
>>> s = s.decode('unicode_escape')
>>> print s
人生苦短,py是岸

二、

  另外,在python2的字符编码问题时常会遇到“UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-5: ordinal not in range(128)”的编码错误。

而用以下方法通常可以解决:

 import sys
reload(sys)
sys.setdefaultencoding('utf-8')

  此方法是将Python2的默认编码ASCII改为 utf-8。但此方法不是一劳永逸的,可能会使一些代码的行为变得怪异。

  可以参考该连接:http://blog.ernest.me/post/python-setdefaultencoding-unicode-bytes

最新文章

  1. 为什么 NaN 不等于自身?
  2. iOS block
  3. Python 小问题解决
  4. Qt学习 之 Socket通信(世界上最简单的例子了)
  5. memcached介绍及基本使用
  6. angular学习(一):动态模板总结
  7. Java程序猿之从菜鸟到职场高手的必看
  8. 用ifconfig命令,只有lo,没有eth0的解决方案
  9. IE浏览器下使用AJAX登陆接口请求缓存与登陆不了的问题解决
  10. 【转载】CSS3 filter:drop-shadow滤镜与box-shadow区别应用
  11. React版本更新及升级须知(持续更新)
  12. vue 在已有的购买列表中(数据库返回的数据)修改商品数量
  13. hadoop配置文件详解系列(二)-hdfs-site.xml篇
  14. ACM字符串输入问题
  15. git 之连接tfs的git服务器
  16. 卷积的三种模式:full, same, valid
  17. ListView的基本使用方法和RecyclerView的基本使用方法
  18. git忽略UserInterfaceState.xcuserstate
  19. 数据库所有者 (dbo)
  20. python之面向对象之类变量和实例变量

热门文章

  1. abrt-hook-ccpp: Saved core dump of pid 12224导致dn挂掉问题
  2. App前后台判断
  3. eclipse安装Veloeclipse
  4. css3样式二
  5. 20160626001 O2O Website
  6. 关于sql 的列转行
  7. linux 调用java main方法
  8. Eclipse+maven+scala2.11.8+spark2.0.0的环境部署
  9. WebForm基础
  10. String 字符串递归截取字节字符串