#-*- coding:utf8 -*-
s = u'中文截取'
s.decode('utf8')[0:3].encode('utf8')
# 结果u'中文截取
延伸阅读:
UTF-8中的汉字占用多少字节?
占2个字节的:〇
占3个字节的:基本等同于GBK,含21000多个汉字
占4个字节的:中日韩超大字符集里面的汉字,有5万多个
一个UTF-8数字占1个字节
一个UTF-8英文字母占1个字节
 
在查找 UTF-8 编码资料时发现,很多的帖子说的 UTF-8 编码里,一个汉字占用3个字节,有的还做了个证明,大概是这样的,创建一个没有BOM的UTF-8编码的文本文件,里面保存了几个汉字,然后查看文件的大小。我觉得这样的证明没有一点说服力,因为 UTF-8 是变长的,1-6个字节,少量的汉字检测是不能说明所有的汉字都是的。
后来我又查看了字符映射表-汉语,找到了正确的答案,少数是汉字每个占用3个字节,多数占用4个字节。

最新文章

  1. ftp 根据特定正则匹配文件名 下载到本地 并且上传文件到ftp java *** 最爱那水货
  2. c#自适应窗体的实现
  3. 2016全国研究生数学建模A题多无人机协同任务规划——基于分布式协同多旅行商MTSP遗传算法
  4. [芯片] 4、接口技术·实验四·串行接口8251A
  5. 使用Dropbox提高个人数据管理效率
  6. ACM——A + B Problem (4)
  7. 用Org-Mode和Jekll写博客
  8. 那些年被我坑过的Python——道阻且长(第五章实用模块讲解)
  9. InstallShield Limited Edition for Visual Studio 2013
  10. iOS下的实际网络连接状态检测(转)
  11. [原]逆向iOS SDK -- +[UIImage imageNamed:] 的实现
  12. Zeppelin 用jdbc连接hive报错
  13. .NET技术+25台服务器怎样支撑世界第54大网站
  14. 【C++】智能指针详解(二):auto_ptr
  15. 201521123019 《Java程序设计》第7周学习总结
  16. 不用asp.net MVC,用WebForm照样能够实现MVC
  17. struts2.5入门
  18. IO伪异步实现
  19. 一些关于SQL优化的总结
  20. docker的安装教程

热门文章

  1. Android开发--微信布局(ListView)基本运用
  2. MSSQLSERVER之发布-分发-订阅
  3. CADisplayLink以及和NSTimer的区别
  4. 127.0.0.1和localhost完全相等吗?
  5. 在linux上使用交换文件扩展交换空间
  6. PHP生成静态页
  7. Android 下拉刷新框架实现
  8. [INS-32025] 所选安装与指定 Oracle 主目录中已安装的软件冲突
  9. python之urllib
  10. mac操作快捷键