sax 解析xml 内容过长

本文介绍了SAXparser如何分块读取XML文档,每次读取2K字节并填充到数组ch中。文章解释了由于这种读取方式可能导致元素值不完整地分布在ch数组中的问题,并提供了解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

SAX parser 分块读取流, 默认为一次读取2K字节. (ch 里面不仅包含元素的值信息,其实它是整个xml文档的一个部分,也就是说,分析器每次从文档中读取2K字节,放到这个数组中,然后通过start和 length来划分出属于value的部分.这样的话,不能保证最后一个元素的值是完全被包含在这个ch中的).

所以我们还是要进行一些额外的操作才能通过 characters(char ch[],int start,int length)获得完整的element value.

Parser每次读取2K字节去填充ch. 填充顺序是从开头到结尾来覆盖原有的值, 所以在最后一次读取文档的时候,可能剩余部分不足2K,所以就会出现ch 中,前半部分是 文档的末尾部分, 而ch后半部分还有多余的信息,这个是倒数第二个ch中未被覆盖掉的部分。
解决办法:
声明一个StringBuffer在存放节点值
在startElement 或endElement时将StringBuffer置为空
characters作值相加就可以了
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值