python-字符转换遇到的问题
2024-09-04 12:19:50
1,异常: 'ascii' codec can't encode characters
字符集的问题,在文件前加两句话:
import sys
reload(sys)
sys.setdefaultencoding( "utf-8" )
2,unicode中的‘\xa0’字符在转换成gbk编码时会出现问题,gbk无法转换'\xa0'字符。
所以,在转换的时候必需进行一些前置动作:
将'\xa0‘替换成u' '空格。
3
#! /usr/bin/env python
#coding=utf-8
s=raw_input()
print s,type(s),len(s)
s=s.decode("gbk")
print s,type(s),len(s)
s=s.encode("utf-8")
print s,type(s),len(s)
s="中国"
print s,type(s),len(s)
中国
中国 <type 'str'> 4
中国 <type 'unicode'> 2
中国 <type 'str'> 6
中国 <type 'str'> 6
raw_input读入是gbk编码的,汉字和字母都是
4正则匹配language
#get each language parts:
findPart(u"[\u4e00-\u9fa5]+", usample, "unicode chinese")
findPart(u"[\uac00-\ud7ff]+", usample, "unicode korean")
findPart(u"[\u30a0-\u30ff]+", usample, "unicode japanese katakana")
findPart(u"[\u3040-\u309f]+", usample, "unicode japanese hiragana")
findPart(u"[\u3000-\u303f\ufb00-\ufffd]+", usample, "unicode cjk Punctuation")
最新文章
- 纯css实现照片墙3D效果
- Android 手机卫士11--窗体弹出PopupWindow
- Linux启动Apache支持.htaccess伪静态文件方法
- 利用redis写webshell
- java 语法错误 (操作符丢失) 在查询表达式
- 【英语】Bingo口语笔记(5) - 英式和美式英语的发音区别
- int21 h
- IIS启用GZip压缩
- wifi驱动总结(2)
- Vue框架是什么,有什么特点,怎么用
- 关于第二次阅读作业中";银弹";“大泥球”等的个人理解
- python实现单链表的翻转
- 《Linux就是这个范儿》
- ping命令和telnet命令
- vue elementui form表单验证
- 将Vue插件发布到npm的完整记录
- JournalNode的作用
- Linux下使用ping出现destination is unreachable的问题可能性
- python装饰器中functools.wraps的作用详解
- JavaScript js调用堆栈(二)