Unicode编码与中文互转
2024-08-24 02:21:03
/**
* unicode编码转换为汉字
* @param unicodeStr 待转化的编码
* @return 返回转化后的汉子
*/
public static String UnicodeToCN(String unicodeStr) {
Pattern pattern = Pattern.compile("(\\\\u(\\p{XDigit}{4}))");
Matcher matcher = pattern.matcher(unicodeStr);
char ch;
while (matcher.find()) {
//group
String group = matcher.group(2);
//ch:'李四'
ch = (char) Integer.parseInt(group, 16);
//group1
String group1 = matcher.group(1);
unicodeStr = unicodeStr.replace(group1, ch + "");
} return unicodeStr.replace("\\", "").trim();
}
/**
* 汉字转化为Unicode编码
* @param CN 待转化的中文
* @return 返回转化之后的unicode编码
*/
public static String CNToUnicode(String CN) { try {
StringBuffer out = new StringBuffer("");
//直接获取字符串的unicode二进制
byte[] bytes = CN.getBytes("unicode");
//然后将其byte转换成对应的16进制表示即可
for (int i = 0; i < bytes.length - 1; i += 2) {
out.append("\\u");
String str = Integer.toHexString(bytes[i + 1] & 0xff);
for (int j = str.length(); j < 2; j++) {
out.append("0");
}
String str1 = Integer.toHexString(bytes[i] & 0xff);
out.append(str1);
out.append(str);
}
return out.toString();
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
return null;
}
测试
public static void main(String[] args) {
String Unicodestr = "\\u674e\\u56db";
System.out.println("unicode为\\u674e\\u56db对应的中文是:"+Util.UnicodeToCN(Unicodestr));
String CNStr = "李四";
System.out.println("李四对应的Unicode编码是:"+Util.CNToUnicode(CNStr)); }
测试结果:
这里可能需要解释的是:\ufeff。\ufeff表示的是UTF-16(大端序)的编码方式。在显示的时候可以将\ufeff过滤掉
最新文章
- instancesRespondToSelector与respondsToSelector的区别
- 压力测试报出503错误---ASP.NET支持大并发的相关配置
- redis session共享中的序列化问题
- Codeforces Round #382 (Div. 2) A. Ostap and Grasshopper bfs
- LINQ to DataSet的DataTable操作
- Qt之等待提示框(QTimer)
- 【转】IT管理人才必备的十大能力
- <;<;c 和指针 >;>; 部分笔记。
- Scala学习——基础篇
- linux下安装jira详细步骤
- 【转】Android 学习笔记——利用JNI技术在Android中调用、调试C++代码
- nosql数据库选型
- 浏览器控制台console的使用
- Oracle基础知识整理
- Aspects 源码学习
- python requests库学习笔记(下)
- CodeForces - 833B The Bakery
- Luogu P2575 高手过招
- Linux下初次使用github
- 加密对象到locastorage / 从 locastorage解密对象