“纵有疾风来,人生不言弃”,这句话送给正在学习golang的朋友们,也希望在阅读本文《如何将大量数据编组为 XML》后,能够真的帮助到大家。我也会在后续的文章中,陆续更新Golang相关的技术文章,有好的建议欢迎大家在评论留言,非常感谢!
问题内容
我需要通过 XML 发送大量数据,而我的 Docker 容器在执行该任务时内存不足。有没有一种方法可以使用 Go 增量编组大型 XML 文档,并将其增量写入文件以最大限度地减少内存使用?
解决方案
使用 xml.Encoder 将 xml 输出流式传输到 io.Writer,该 io.Writer 可能是网络连接 (net.Conn) 或文件 (os.File)。完整的结果不会保存在内存中。
您可以使用 Encoder.Encode() 将 go 值编码为 xml。一般来说,您可以传递任何要传递给 xml.Marshal() 的 go 值。
encoder.encode() 仅当您要编组的数据已在内存中准备好时才有帮助,这对您来说可能可行也可能不可行。例如。如果你想编组一个不能(或不应该)读入内存的大列表,这对你来说不会是一个拯救。
如果输入数据也无法保存在内存中,那么您可以通过标记和元素构造 xml 输出。您可以为此使用 Encoder.EncodeToken(),它允许您编写结果 xml 文档的“部分”。
例如,如果您想将一个大列表写入输出,您可以编写一个开始元素标记(例如 <list>),然后逐一写入列表的元素(每个元素从数据库或文件中获取,或由动态算法构造),一旦列表被封送,您就可以关闭列表元素标签(</list>)。
这是一个简单的示例,说明如何做到这一点:
type student struct {
id int
name string
}
func main() {
he := func(err error) {
if err != nil {
panic(err) // in your app, handle error properly
}
}
// for demo purposes we use an in-memory buffer,
// but this may be an os.file too.
buf := &bytes.buffer{}
enc := xml.newencoder(buf)
enc.indent("", " ")
he(enc.encodetoken(xml.startelement{name: xml.name{local: "list"}}))
for i := 0; i < 3; i++ {
// here you can fetch / construct the records
he(enc.encode(student{id: i, name: string(i + 'a')}))
}
he(enc.encodetoken(xml.endelement{name: xml.name{local: "list"}}))
he(enc.flush())
fmt.println(buf.string())
}
上面的输出是(在 Go Playground 上尝试一下):
<list>
<Student>
<ID>0</ID>
<Name>A</Name>
</Student>
<Student>
<ID>1</ID>
<Name>B</Name>
</Student>
<Student>
<ID>2</ID>
<Name>C</Name>
</Student>
</list>
今天关于《如何将大量数据编组为 XML》的内容就介绍到这里了,是不是学起来一目了然!