Go语言怎么自定义XML元素的解析和编码

admin 百科 13
Go语言XML处理核心是struct标签与xml.Unmarshaler/Marshaler接口:标签控制字段映射、属性、忽略、innerxml等;接口实现定制解析/编码逻辑,需主动调用Token方法。

Go语言怎么自定义XML元素的解析和编码-第1张图片-佛山资讯网

Go语言通过encoding/xml包提供XML解析与编码能力,自定义行为主要靠结构体标签(struct tags)和实现特定接口(如xml.Unmarshalerxml.Marshaler)来完成。核心在于控制字段映射、跳过字段、重命名元素、处理嵌套或特殊格式内容。

用struct标签精细控制字段映射

结构体字段通过xml:标签声明如何参与XML序列化/反序列化,常用选项包括:

  • 字段名重命名xml:"book"让字段在XML中以<book></book>出现,而非默认的驼峰转小写加连字符
  • 忽略字段xml:"-"完全跳过该字段;xml:",omitempty"仅在值为空(零值)时省略该元素或属性
  • 作为XML属性xml:"id,attr"将字段编码为同级元素的属性,如<book id="123"></book>
  • 捕获原始XML内容xml:",innerxml"把子元素的全部未解析内容存入字符串字段(适合混合内容或需手动处理的片段)
  • 指定为字符数据(CDATA):暂无原生标签支持,但可通过自定义MarshalXML实现

实现xml.Unmarshaler来自定义解析逻辑

当默认解析无法满足需求(如解析带单位的数字<size unit="cm">150</size>,或兼容多种格式),可让结构体实现UnmarshalXML(d *xml.Decoder, start xml.StartElement) error方法。

例如,解析一个带单位的尺寸字段:

立即学习“go语言免费学习笔记(深入)”;

type Size struct {
    Value float64 `xml:"-"`
    Unit  string  `xml:"unit,attr"`
}

func (s *Size) UnmarshalXML(d *xml.Decoder, start xml.StartElement) error {
    // 先读取属性
    for _, attr := range start.Attr {
        if attr.Name.Local == "unit" {
            s.Unit = attr.Value
        }
    }
    // 再读取文本内容
    token, err := d.Token()
    if err != nil {
        return err
    }
    if se, ok := token.(xml.CharData); ok {
        s.Value, _ = strconv.ParseFloat(strings.TrimSpace(string(se)), 64)
    }
    return nil
}

登录后复制

实现xml.Marshaler来自定义编码逻辑

类似地,实现MarshalXML(e *xml.Encoder, start xml.StartElement) error可完全控制输出格式。比如强制输出为CDATA、添加命名空间、或按业务规则生成嵌套结构。

标签: go go语言 编码 xml解析 xml处理

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~