StaxEventItemReader 可流式读取大型 XML 文件,避免内存溢出,适用于结构扁平、重复标签(如 order)的场景;需配置 resource、fragmentRootElementName、unmarshaller 等,并确保 Java Bean 含正确 JAXB 注解。

Spring Batch 使用 StaxEventItemReader 可以高效、流式地读取大型 XML 文件,避免将整个文档加载到内存,适合处理结构清晰、重复标签的 XML 数据(如订单列表、用户清单等)。它基于 StAX(Streaming API for XML),底层使用 Woodstox 或 JDK 自带的 StAX 实现。
XML 结构需满足可映射前提
StaxEventItemReader 不解析任意嵌套 XML,它依赖“扁平化”的重复元素作为业务对象单位。例如:
<?xml version="1.0" encoding="UTF-8"?>
<orders>
<order id="1001">
<customerName>Alice</customerName>
<amount>299.99</amount>
</order>
<order id="1002">
<customerName>Bob</customerName>
<amount>149.50</amount>
</order>
</orders>登录后复制
其中每个 <order></order> 是一个独立 item,StaxEventItemReader 会逐个提取并映射为 Java 对象。
配置 StaxEventItemReader 的关键项
需指定资源路径、根标签名、映射处理器(Unmarshaller)及命名空间(如有):
-
resource:XML 文件路径,支持
FileSystemResource、ClassPathResource等 -
fragmentRootElementName:每个 item 对应的 XML 元素名(如
"order") -
unmarshaller:用
Jaxb2Marshaller将 XML 片段反序列化为 Java Bean(Bean 需加@XmlRootElement和字段级@XmlElement) -
namespaceAware:设为
true若 XML 含命名空间(如xmlns="http://example.com/ns"),此时需在unmarshaller中注册 namespace handler 或使用@XmlSchema
写入 XML:用 StaxEventItemWriter
对应读取,StaxEventItemWriter 支持流式写入。需配置:
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。
还木有评论哦,快来抢沙发吧~