python之将Unicode文本标准化
2024-09-30 08:33:47
在需要比较字符串的程序中使用字符的多种表示会产生问题。 为了修正这个问题,你可以使用unicodedata模块先将文本标准化:
s1 = 'Spicy Jalape\u00f1o'
s2 = 'Spicy Jalapen\u0303o'
print(s1==s2) # False
两个字符串表达不一样,可以使用unicodedata模块先将文本标准化:
import unicodedata
# normalize() 第一个参数指定字符串标准化的方式。 NFC表示字符应该是整体组成(比如可能的话就使用单一编码),而NFD表示字符应该分解为多个组合字符表示
t1=unicodedata.normalize("NFC",s1)
t2=unicodedata.normalize("NFC",s2 )
print(t1==t2) # True
最新文章
- linq to js使用汇总
- 【实战Java高并发程序设计 4】数组也能无锁:AtomicIntegerArray
- Java中的访问控制权限
- WIN7-64位安装PLSQL-Developer步骤
- Java for LeetCode 237 Delete Node in a Linked List
- SharePoint 2010顶部链接导航栏的详细操作
- Windows Phone开发(37):动画之ColorAnimation
- 安卓 ArrayList,LinkedList,HashSet,Vector,TreeSet的区别和使用
- Ext viewport的渲染
- STL仿函数functor
- servlet3异步原理与实践
- linux 学习笔记 APACHE安装总结
- Scala 上下文界定
- atoi函数原型
- sql server导入excel数据
- [SublimeText] 如何创建工程
- 网络协议栈学习(二)创建 socket
- eval是只读数据,bind是可更新的.
- AtCoder Grand Contest 005
- C++中getline()和cin()同时使用时的注意事项
热门文章
- Oracle学习笔记<;3>;
- 查看x86主機是否支援64bit in Linux
- Codefores 507D The Maths Lecture( 数位DP )
- Java-技术专区-如何监控Java线程池的状态
- Skimap_ros 利用RGBD创建Octomap(一)
- capserjs-prototype(上)
- js实现图片延迟加载原理
- 2019-9-2-win10-uwp-九幽图床
- windows自动关机(任务计划程序 + exe文件)
- Redis的常用功能