XML中文乱码主因是声明编码与实际保存编码不一致,需统一XML声明encoding值与文件真实编码,用编辑器另存为UTF-8(推荐无BOM),程序解析时也须显式指定对应编码。

XML文件出现中文乱码,绝大多数是因为声明的编码格式与实际保存的编码不一致,最常见的是文件以UTF-8保存,但XML声明写成了<?xml version="1.0" encoding="GBK"?>,或压根没写encoding属性。
检查并统一XML声明与文件实际编码
打开XML文件(推荐用记事本、VS Code、Notepad++等能显示编码的编辑器),确认两件事:
- 文件顶部是否有
<?xml version="1.0" encoding="xxx"?>声明; - 该声明中的
encoding值(如UTF-8、GBK、ISO-8859-1)是否与文件当前真实编码一致。
例如:若用VS Code打开显示右下角是“UTF-8”,但XML头写的是encoding="GBK",就必须改成encoding="UTF-8";反之亦然。修改后务必保存。
用文本编辑器正确另存为UTF-8(带BOM或无BOM)
很多乱码源于编辑器默认保存为ANSI(Windows下常为GBK),而非UTF-8。解决方法:
标签: linux python java windows 编码 浏览器 mac 中文乱码 macos win stream 解
还木有评论哦,快来抢沙发吧~