go基础库之有效地解析大型XML文件

栏目: 编程语言 · XML · 发布时间: 4年前

内容简介:XML是一种非常常见的数据交换格式。Go库包含对以与JSON相同的方式解析XML文件的支持。通常,使用与XML方案对应的结构,并且在此帮助下,一次解析XML内容。问题是当XML文件太大而无法容纳到内存中时,需要以块的形式解析文件。本文将展示如何处理大型XML文件并解析所需信息。

XML是一种非常常见的数据交换格式。Go库包含对以与JSON相同的方式解析XML文件的支持。通常,使用与XML方案对应的结构,并且在此帮助下,一次解析XML内容。问题是当XML文件太大而无法容纳到内存中时,需要以块的形式解析文件。本文将展示如何处理大型XML文件并解析所需信息。

有效地解析大型XML文件

Golang 版本

1.12.1

前沿

XML是一种非常常见的数据交换格式。Go库包含对以与JSON相同的方式解析XML文件的支持。通常,使用与XML方案对应的结构,并且在此帮助下,一次解析XML内容。问题是当XML文件太大而无法容纳到内存中时,需要以块的形式解析文件。本文将展示如何处理大型XML文件并解析所需信息。

实现

创建文件 data.xml ,内容如下:

<?xml version="1.0"?>
       <catalog>
         <book id="bk101">
           <author>Gambardella, Matthew</author>
           <title>XML Developer's Guide</title>
           <genre>Computer</genre>
           <price>44.95</price>
           <publish_date>2000-10-01</publish_date>
           <description>An in-depth look at creating applications 
            with XML.</description>
         </book>
         <book id="bk112">
           <author>Galos, Mike</author>
           <title>Visual Studio 7: A Comprehensive Guide</title>
           <genre>Computer</genre>
           <price>49.95</price>
           <publish_date>2001-04-16</publish_date>
           <description>Microsoft Visual Studio 7 is explored
            in depth, looking at how Visual Basic, Visual C++, C#,
            and ASP+ are integrated into a comprehensive development
            environment.</description>
         </book>
       </catalog>

创建文件 xml.go ,代码如下:

package main

import (
	"encoding/xml"
	"fmt"
	"os"
)

type Book struct {
	Title  string `xml:"title"`
	Author string `xml:"author"`
}

func main() {

	f, err := os.Open("data.xml")
	if err != nil {
		panic(err)
	}
	defer f.Close()
	decoder := xml.NewDecoder(f)

	// 逐一阅读本书
	books := make([]Book, 0)
	for {
		tok, _ := decoder.Token()
		if tok == nil {
			break
		}
		switch tp := tok.(type) {
		case xml.StartElement:
			if tp.Name.Local == "book" {
				// 将元素解码为struct
				var b Book
				decoder.DecodeElement(&b, &tp)
				books = append(books, b)
			}
		}
	}
	fmt.Println(books)
}
$ go run xml.go
[{XML Developer's Guide Gambardella, Matthew} {Visual Studio 7: A Comprehensive Guide Galos, Mike}]

原理

使用 xml 包的 NewDecoder 函数,可以创建XML内容的 Decoder

通过在 Decoder 上调用 Token 方法,接收 xml.Tokenxml.Token 是保存令牌类型的接口。 可以根据类型定义代码的行为。 示例代码测试解析的 xml.StartElement 是否是 book 元素之一。 然后它将数据部分解析为 Book 结构。 这样, Decoder 中底层 Reader 中指针的位置被struct数据移位,并且解析可以继续。


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

C语言名题精选百则技巧篇

C语言名题精选百则技巧篇

冼镜光 / 机械工业出版社 / 2005-7 / 44.00元

《C语言名题精选百则》(技巧篇)收集了100则C语言程序设计题,共分9类。第一类比较简单,主要希望读者了解到《C语言名题精选百则》(技巧篇)的题目、解法与其他书籍之间的差异;第二至六类分别是关于数字、组合数学或离散数学、查找、排序、字符串等方面的题目;第七类列出了一些不太容易归类的题目,如Buffon丢针问题、Dijkstra的三色旗问题等;第八类则收录了一些有趣的、娱乐性的题目,如魔方阵等;第九......一起来看看 《C语言名题精选百则技巧篇》 这本书的介绍吧!

JS 压缩/解压工具
JS 压缩/解压工具

在线压缩/解压 JS 代码

随机密码生成器
随机密码生成器

多种字符组合密码

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具