今天写的一个服务程序,有人报告获得的数据中文乱码,而我是用 apache 通过 httpComponents 去取得数据的。于是开启日志的 debug 级别。

在日志里果然发现中文不见了,有乱码出现:

  1. 2014-07-02 16:35:01.348 DEBUG [Wire.java:86] http-outgoing-8 << "<? xml version="1.0" encoding="UTF-8"?>... subject="[0xe6][0x88][0x91][0xe6][0x98][0xaf][0xe4][0xb8][0xad][0xe6][0x96][0x87][0xe4][0xb8][0xbb][0xe9][0xa2][0x98]" ...

我发出的报文怎么会乱码?明明我设置了 utf-8 编码的啊!

事实上,这是第一个坑:httpComponents 打日志的时候。把中文转成了这样的格式。事实上是对的。

可怜的我在这个坑里转了好久才发现啊!

最后找了半天,通过抓包才最终发现。发送、接收到的中文报文都没问题,可是我解出来的中文乱码了。折腾半天后才发现,远程server返回时,没返回编码。而我获取包体的代码是用的 EntityUtils :

  1. CloseableHttpResponse httpResponse = httpClient.execute(get);
  2. HttpEntity httpResponseEntity = httpResponse.getEntity();
  3. String s = EntityUtils.toString(httpResponseEntity);

似乎没问题啊。可是,这就是个大坑了。httpComponents 的默认代码并不是 utf-8

于是这个 s 就乱了……

正确的写法事实上是

  1. EntityUtils.toString(httpResponseEntity, "utf-8");

顺便说一下。曾经我、还有我同事都踩过的一个坑。

  1. EntityUtils.toString(httpResponseEntity, "utf-8");

这行代码在 http 请求时必须调用!

或者说。返回的包体流必须被读完。即使返回的不是 200 OK。

曾经因为对返回的包体内容不关心,所以没调。然后第一个请求能够成功,而第二个请求就卡住……

更坑的是 200 OK的时候读包体流。而错误的时候直接抛异常或者返回了。然后程序工作看起来正常,但时不时的卡啊卡……

最新文章

  1. 用js计算从开始到结束时间之内的按周值选定
  2. ajax头像上传
  3. ASP出500错误怎么办(理论上并不止500错误,其他错误可以同样可以获得更多信息以帮助解决问题)
  4. 挖Linux中的古老缩略语
  5. SharePoint 2010/SharePoint 2013 Custom Action: 基于Site Collection 滚动文字的通知.
  6. Git-it:一个学习Git和Github的教程(软件)
  7. js获取本月、三个月、今年的日期插件dateHelp
  8. 创建android画笔程序的样例(有镜面效果)
  9. Java多线程:队列与阻塞队列
  10. java -- 对Map按键排序、按值排序
  11. 基于FPGA视频时序生成中的库文件
  12. linq 把list分组为 List&lt;List&gt;
  13. hdu 5060 五种情况求圆柱体与球体交
  14. 使用CSS 3创建不规则图形
  15. ubuntu配置JDK
  16. MySQL my.cnf参数配置优化详解
  17. Qt动态连接库/静态连接库创建与使用,QLibrary动态加载库
  18. Delphi APP 開發入門(三)簡易計算機
  19. xcode好玩的条件断点设置. 可以真人发声。
  20. 矩阵乘法C语言实现

热门文章

  1. Oracle基础 05 联机日志 redolog
  2. JVM垃圾收集规则和算法
  3. 第一步:Java开发环境的配置
  4. 通过docker info命令,可以了解很多信息
  5. (九)MySQL用户和权限管理
  6. (1)Python 安装使用IDLE
  7. 洛谷 P1068 分数线划定【结构体排序】
  8. HDU 6208 The Dominator of Strings【AC自动机/kmp/Sunday算法】
  9. Hash算法详解
  10. 学懂grid布局:这篇就够了(译)