什么是Schematron Schematron规则验证教程

admin 百科 12
Schematron是一种基于XPath的XML验证语言,专注业务规则而非结构定义,通过assert/report实现断言检查,由schema、pattern、rule三层结构组成,常与XSD互补使用。

什么是Schematron Schematron规则验证教程-第1张图片-佛山资讯网

什么是Schematron

Schematron 是一种基于 XPath 的 XML 文档验证语言,它不描述数据结构,而是表达业务规则和逻辑约束。和 XML Schema(XSD)不同,Schematron 不关心元素是否合法、是否嵌套正确、类型是否匹配,而是专注“这个 XML 是否满足我的业务要求”。比如:“每个 book 元素必须包含一个非空的 title”,或“当 statusarchived 时,expiryDate 不得为空”。这类判断靠断言(assert)或报告(report)实现。

Schematron 规则的基本结构

一个 Schematron 文件本质是 XML,核心由三部分组成:

  • schema:根元素,声明命名空间 http://purl.oclc.org/dsdl/schematron
  • pattern:一组相关规则的容器,可带 ID 和名称,用于组织逻辑域(如“元数据规则”“业务状态规则”)
  • rule:定义验证上下文(用 @context 指定 XPath 路径),内部包含 <assert></assert><report></report>

例如:

<schema xmlns="http://purl.oclc.org/dsdl/schematron">
  <pattern id="book-rules">
    <rule context="book">
      <assert test="title and normalize-space(title)">
        每本图书必须有非空标题。
      </assert>
      <assert test="price > 0">
        图书价格必须大于零。
      </assert>
    </rule>
  </pattern>
</schema>

登录后复制

如何用 Python(lxml)做 Schematron 验证

最常用且轻量的方式是使用 lxml.etree.Schematron。前提是已安装 lxml(pip install lxml):

标签: python 工具 ai win

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~