版权声明:

欢迎转载,但请保留文章原始出处

作者:GavinCT

出处:http://www.cnblogs.com/ct2011/p/4002738.html

什么时候可以把解析值赋给对象

一般从网上看到的sax解析,都是在Handler中的characters方法进行对象数据的赋值。

示例代码如下:

private TransportFile parseXML(String xml) {
SAXParserFactory saxfac = SAXParserFactory.newInstance();
try {
SAXParser saxparser = saxfac.newSAXParser();
InputStream is = new ByteArrayInputStream(xml.getBytes());
MySAXHandler handler = new MySAXHandler();
saxparser.parse(is, handler);
return handler.getData();
} catch (ParserConfigurationException e) {
e.printStackTrace();
} catch (SAXException e) {
e.printStackTrace();
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
return null;
}
private class MySAXHandler extends DefaultHandler{
String currentTagName = "";
TransportFile mData = null ;
@Override
public void startElement(String uri, String localName, String qName,
Attributes attributes) throws SAXException {
currentTagName = qName ;
if("file".equals(qName)){
mData = new TransportFile();
}
} @Override
public void characters(char[] ch, int start, int length)
throws SAXException {
String str = new String(ch,start,length);
if("guid".equals(currentTagName)){
mData.guid = str;
}else if("name".equals(currentTagName)){
mData.name = str;
}else if("type".equals(currentTagName)){
mData.type = str;
}else if("length".equals(currentTagName)){
mData.length = Long.parseLong(str);
}else if("index".equals(currentTagName)){
mData.index = Integer.parseInt(str);
}else if("count".equals(currentTagName)){
mData.count = Integer.parseInt(str);
}else if("data".equals(currentTagName)){
mData.data = Base64.decode(str);
}
} @Override
public void endElement(String uri, String localName, String qName)
throws SAXException {
currentTagName = "";
} public TransportFile getData(){
return mData ;
}
}

普通的使用场景中上述代码没有问题,但是当xml中某一标签的内容很长时,就会引发上述代码的bug。

实践发现sax解析每次也就解析1k左右的数据,超出部分其实是要分段多次解析的。

所以问题来了,如果在characters方法中解析,那么其他几段的数据仍然会不断覆盖最终返回对象中的数据,导致数据丢失。

因此,对于赋值给最终传回对象的数据,在characters阶段只能不断拼接,解析必须在endElement时才可以完成。否则当数据内容比较大的时候,网上代码中的bug就会凸显出来。

顺便贴上我的代码:

    private class MySAXHandler extends DefaultHandler{
String currentTagName = "";
TransportFile mData = null ;
@Override
public void startElement(String uri, String localName, String qName,
Attributes attributes) throws SAXException {
currentTagName = qName ;
mStringBuilder = new StringBuilder();
if("file".equals(qName)){
mData = new TransportFile();
}
}
private StringBuilder mStringBuilder;
@Override
public void characters(char[] ch, int start, int length)
throws SAXException {
mStringBuilder.append(ch, start, length);
} @Override
public void endElement(String uri, String localName, String qName)
throws SAXException {
String str = mStringBuilder.toString();
if("guid".equals(currentTagName)){
mData.guid = str;
}else if("name".equals(currentTagName)){
mData.name = str;
}else if("type".equals(currentTagName)){
mData.type = str;
}else if("length".equals(currentTagName)){
mData.length = Long.parseLong(str);
}else if("index".equals(currentTagName)){
mData.index = Integer.parseInt(str);
}else if("count".equals(currentTagName)){
mData.count = Integer.parseInt(str);
}else if("data".equals(currentTagName)){
mData.data = Base64.decode(str);
}
currentTagName = "";
} public TransportFile getData(){
return mData ;
}
}

characters方法参数注意

ch是当前解析到的字符数组,并不是精确的标签内的内容。

下面是解析第一个标签时characters中 ch 、 start、length输出:

===========characters ch: <?xml version='1.0' encoding='utf-8' standalone='yes' ?><file><guid>678c6f92-d617-40af-bb87-a80c3b2be91f</guid><name>0CAQLTZGO.jpg</name><type>image</type><length>71374</length><index>0</index><count>1</count><data>/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAYEBQYFBAYGBQYHBwYIChAKCgkJChQODwwQFxQYGBcUFhYaHSUfGhsjHBYWICwgIyYnKSopGR8tMC0oMCUoKSj/2wBDAQcHBwoIChMKChMoGhYaKCgoKCgoK.....
===========characters start:31
===========characters length:36

真正当前需要的数据是ch数组从start开始的length个字符。

最新文章

  1. PHP返回XML数据
  2. UVA 10498 Happiness(线性规划-单纯形)
  3. mapred和mapreduce
  4. CDOJ 1157 数列(seq) 分块+线段树
  5. 简单工厂模式的C++实现
  6. ArcSDE for Oracle表空间管理——暂时(TEMP)表空间
  7. 在DLL中封装的VCL窗体Tab键响应的问题
  8. C语言总结2
  9. [Centos] mod_wsgi 安装流程以及遇到问题解决办法。apxs: command not found 或 Sorry, Python developer package does not appear to be installed.
  10. reshape2 数据操作 数据融合( cast)
  11. javascript 函数的基础知识
  12. golang 轮训加密算法
  13. 乐动力APP案例
  14. CSS属性操作/下
  15. c# 虚拟路径转化为物理路径
  16. .net中的设计模式---单例模式
  17. centos 7 之nginx
  18. php 命令行参数
  19. python爬虫实例--网易云音乐排行榜爬虫
  20. 关于封装了gevent的request grequest库的使用与讨论

热门文章

  1. 一文详解python的类方法,普通方法和静态方法
  2. 获取列表数据时,getList 设置默认参数:getList(page = 1),点击分页及前往时,传page参数,其他使用page的默认值:1
  3. jboss5+EJB3+MDB Queue
  4. Java之集合(二十六)ConcurrentSkipListMap
  5. 如何正确删除VMare虚拟机上的系统机器(图文详解)
  6. js便签笔记(2)——DOM元素的特性(Attribute)和属性(Property)
  7. Linux命令-用户、用户组、权限
  8. springcloud-03-服务注册
  9. Oracle 12c 建表空间语句
  10. 本地git关联远程github