DOMDocument 是 PHP 处理 XML/HTML 的标准类,需注意编码一致、空白节点处理及错误屏蔽:加载前设 preserveWhiteSpace=false、libxml_use_internal_errors(true),显式指定 encoding;保存时启用 formatOutput=true 可格式化输出。

PHP 的 DOMDocument 类是处理 XML(和 HTML)最常用、最标准的方式。它基于 W3C DOM 规范,支持加载、解析、修改和保存 XML 文档。关键在于:加载要处理编码和错误,保存要注意格式化和编码一致性。
加载 XML 文件或字符串
用 load() 加载文件,loadXML() 加载字符串。默认会解析 DTD 并报告警告(比如编码不匹配、标签未闭合),建议提前配置错误处理:
- 调用
libxml_use_internal_errors(true)屏蔽警告,避免因非致命问题中断执行 - 设置
$doc->encoding = 'UTF-8'显式声明编码(尤其对无声明的 XML) - 若 XML 声明中指定了
encoding="GBK",需确保源内容真实为 GBK,否则解析可能乱码
示例:
标签: php html node 编码 中文乱码 格式化输出
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。
还木有评论哦,快来抢沙发吧~