什么是Unicode?

Unicode(统一码、万国码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。

字符串?

字符串或串(String)是由数字、字母、下划线组成的一串字符。一般记为 s=“a1a2···an”(n>=0)。它是编程语言中表示文本的数据类型。在程序设计中,字符串(string)为符号或数值的一个连续序列,如符号串(一串字符)或二进制数字串(一串二进制数字)。

UTF-8

UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码,由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码Unicode字符。用在网页上可以统一页面显示中文简体繁体及其它语言(如英文,日文,韩文)。

当我们弄清楚已上三种的的区别,相信很多人应该都懂了Unicode字符串和非Unicode字符串的区别吧!

最通俗的讲Unicode字符串和就是将普通字符串给标准化了,它为 每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。

通过以下Python代码,希望大家能理解:

# -*- coding: utf-8 -*-
#!/usr/bin/env python
# @Time : 2018/7/3 10:03
# @Desc :
# @File : test.py
# @Software: PyCharm if __name__ == '__main__':
#定义一般字符串
str="代码帮"
#字符串前面加u,定义标准unicode字符串
unicodestr=u"代码帮"
#将一般字符串转化为标准unicode字符串
unicodestrs = unicode(str, "utf-8")
print str
print unicodestr
print unicodestrs print type(str)
print type(unicodestr)
print type(unicodestrs)

最新文章

  1. js面向对象
  2. 初学git:用git bash往github push代码
  3. Effective C++ 之 Item 1: 视C++为一个语言联邦
  4. ios-通知简单示例
  5. Android手势监听
  6. Uncaught TypeError: Cannot read property 'post' of undefined
  7. HTML5的结构学习(2) --- 新增的非主体结构元素
  8. uva10791 uva10780(分解质因数)
  9. 【canvas系列】用canvas实现一个colorpicker
  10. Loadrunner错误 -27727: 下载资源时步骤下载超时 (120 seconds) 已过期
  11. Linux设备驱动之IIO子系统——Triggered buffer support触发缓冲支持
  12. jar包冲突排解方法(sbt)
  13. [转帖]Windows批处理(cmd/bat)常用命令小结
  14. 【tmos】mvn package相关知识点(待补充...)
  15. [Java学习]多线程
  16. 于dm-0 dm-1
  17. 题解——Codeforces Round #508 (Div. 2) T2 (构造)
  18. postgresql----数组类型和函数
  19. NS3 Ptr<Rocket> 与 TcpRocket 的一个小问题
  20. cdoj842-天下归晋 【树状数组】

热门文章

  1. docker镜像制作必备技能
  2. 移动端的<meta>标签
  3. MySQL 5.7安装(多实例)最佳实践
  4. icon font在sketch中的下载与安装
  5. DRF框架中csrf异常
  6. Flask中的cookie和session
  7. postman环境变量设置
  8. 一次对php大马的后门的简单分析
  9. [Luogu2422]良好的感觉
  10. iview和element中日期选择器快捷选项的定制控件