笔记-python-lib-chardet

1.      chardet

chardet是一个非常优秀的编码识别模块, 是python的第三方库,需要下载和安装。

文档地址:https://pypi.org/project/chardet/

当然它不是所有的编码格式都能识别,具体可识别的编码格式参见文档。

1.1.    installation

pip install chardet

1.2.    使用

1.2.1.   模块内调用

import chardet

rawdata = b'sdfwe'

res = chardet.detect(rawdata)

print(res)

输出:

{'encoding': 'ascii', 'confidence': 1.0, 'language': ''}

1.2.2.   命令行模式

chardet comes with a command-line script which reports on the encodings of one or more files:

% chardetect somefile someotherfile

somefile: windows-1252 with confidence 0.5

someotherfile: ascii with confidence 1.0

1.3.    关于解码原理

It means taking a sequence of bytes in an unknown character encoding, and attempting to determine the encoding so you can read the text. It’s like cracking a code when you don’t have the decryption key.

简单来说,就是从对象中选取一小部分,根据它的特征去猜编码格式。

最新文章

  1. Rocksdb Compaction原理
  2. jquery触屏幻灯片
  3. 把《c++ primer》读薄(1-2前言+变量和基本类型)
  4. 二叉查找树(三)之 Java的实现
  5. 单独调用Ueditor的图片上传功能
  6. hdu 4577 X-Boxes 大数
  7. VC自动与Internet时间服务器同步更新
  8. 页面每次加载时重新获取css文件
  9. Sqlserver 2008R2设置数据库只对特定用户可见
  10. Python协程与asyncio
  11. 【学习总结】Git学习-参考廖雪峰老师教程一-Git简介
  12. 20165221 Linux安装及命令入门学习
  13. 微信OpenID获取
  14. Testing - 软件测试知识梳理 - 自动化测试
  15. 安装 gradle
  16. GC之五--SystemGC完全解读
  17. day103 跨域请求 与频率访问限制.
  18. Cocos2d-x for Windows Phone 用法总结
  19. python小项目之微信远程控制
  20. MySQL的用户账户管理

热门文章

  1. SVN中建立项目
  2. Azure 进阶攻略 | 上云后的系统,「门禁」制度又该如何实现?
  3. check_mk检测插件 - raid监控
  4. ES7的Async/Await的简单理解
  5. 吴超hadoop7天视频教程全集
  6. s7nodave用于上位机连接西门子PLC,开源项目epics
  7. 【2017-07-01】Linux应用开发工程师面试问题记录之二:关于结构体的大小及内存对齐问题
  8. 【JavaScript 封装库】BETA 3.0 测试版发布!
  9. 【转】WebSocket 是什么原理?为什么可以实现持久连接?
  10. [ difflib] simple1.py