Python ElementTree怎么处理命名空间 findall带命名空间

admin 百科 8
ElementTree 的 findall() 处理带命名空间 XML 时必须显式传入 namespaces 参数,命名空间映射需为字典格式,键为 XPath 中使用的前缀(不可为空字符串),值为完整且大小写敏感的 URI;漏传或映射错误将导致查不到元素。

Python ElementTree怎么处理命名空间 findall带命名空间-第1张图片-佛山资讯网

ElementTree 处理带命名空间的 XML 时,findall() 默认不识别命名空间前缀,必须显式传入命名空间映射(namespace map),否则查不到元素。

命名空间映射要写成字典格式

XML 中像 <book xmlns:ns="http://example.com/ns"></book> 这样的命名空间,需用字典把前缀和 URI 关联起来:

  • 键是你在 XPath 中想用的前缀(比如 "ns"),不是 URI
  • 值必须是完整的命名空间 URI 字符串(注意:必须完全一致,包括末尾斜杠、大小写)
  • 前缀名可以自定义,不一定要和 XML 中声明的一样(例如 XML 用 ns,你字典里写 "x" 也行,只要 XPath 里同步用 "x:book"

findall() 调用时必须传入 namespaces 参数

不能只写 root.findall("ns:book"),得加上 namespaces=ns_map

ns_map = {"ns": "http://example.com/ns"}
books = root.findall("ns:book", namespaces=ns_map)

登录后复制

漏掉 namespaces=... 参数,ElementTree 就当没命名空间处理,结果为空列表。

立即学习“Python免费学习笔记(深入)”;

标签: python

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~