Schematron是一种基于XPath的XML验证语言,专注业务规则而非结构定义,通过assert/report实现断言检查,由schema、pattern、rule三层结构组成,常与XSD互补使用。

什么是Schematron
Schematron 是一种基于 XPath 的 XML 文档验证语言,它不描述数据结构,而是表达业务规则和逻辑约束。和 XML Schema(XSD)不同,Schematron 不关心元素是否合法、是否嵌套正确、类型是否匹配,而是专注“这个 XML 是否满足我的业务要求”。比如:“每个 book 元素必须包含一个非空的 title”,或“当 status 为 archived 时,expiryDate 不得为空”。这类判断靠断言(assert)或报告(report)实现。
Schematron 规则的基本结构
一个 Schematron 文件本质是 XML,核心由三部分组成:
-
schema:根元素,声明命名空间
http://purl.oclc.org/dsdl/schematron - pattern:一组相关规则的容器,可带 ID 和名称,用于组织逻辑域(如“元数据规则”“业务状态规则”)
-
rule:定义验证上下文(用
@context指定 XPath 路径),内部包含<assert></assert>或<report></report>
例如:
<schema xmlns="http://purl.oclc.org/dsdl/schematron">
<pattern id="book-rules">
<rule context="book">
<assert test="title and normalize-space(title)">
每本图书必须有非空标题。
</assert>
<assert test="price > 0">
图书价格必须大于零。
</assert>
</rule>
</pattern>
</schema>登录后复制
如何用 Python(lxml)做 Schematron 验证
最常用且轻量的方式是使用 lxml.etree.Schematron。前提是已安装 lxml(pip install lxml):
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。
还木有评论哦,快来抢沙发吧~