内容简介:XML是一种非常常见的数据交换格式。Go库包含对以与JSON相同的方式解析XML文件的支持。通常,使用与XML方案对应的结构,并且在此帮助下,一次解析XML内容。问题是当XML文件太大而无法容纳到内存中时,需要以块的形式解析文件。本文将展示如何处理大型XML文件并解析所需信息。
XML是一种非常常见的数据交换格式。Go库包含对以与JSON相同的方式解析XML文件的支持。通常,使用与XML方案对应的结构,并且在此帮助下,一次解析XML内容。问题是当XML文件太大而无法容纳到内存中时,需要以块的形式解析文件。本文将展示如何处理大型XML文件并解析所需信息。
有效地解析大型XML文件
Golang 版本
1.12.1
前沿
XML是一种非常常见的数据交换格式。Go库包含对以与JSON相同的方式解析XML文件的支持。通常,使用与XML方案对应的结构,并且在此帮助下,一次解析XML内容。问题是当XML文件太大而无法容纳到内存中时,需要以块的形式解析文件。本文将展示如何处理大型XML文件并解析所需信息。
实现
创建文件 data.xml
,内容如下:
<?xml version="1.0"?> <catalog> <book id="bk101"> <author>Gambardella, Matthew</author> <title>XML Developer's Guide</title> <genre>Computer</genre> <price>44.95</price> <publish_date>2000-10-01</publish_date> <description>An in-depth look at creating applications with XML.</description> </book> <book id="bk112"> <author>Galos, Mike</author> <title>Visual Studio 7: A Comprehensive Guide</title> <genre>Computer</genre> <price>49.95</price> <publish_date>2001-04-16</publish_date> <description>Microsoft Visual Studio 7 is explored in depth, looking at how Visual Basic, Visual C++, C#, and ASP+ are integrated into a comprehensive development environment.</description> </book> </catalog>
创建文件 xml.go
,代码如下:
package main import ( "encoding/xml" "fmt" "os" ) type Book struct { Title string `xml:"title"` Author string `xml:"author"` } func main() { f, err := os.Open("data.xml") if err != nil { panic(err) } defer f.Close() decoder := xml.NewDecoder(f) // 逐一阅读本书 books := make([]Book, 0) for { tok, _ := decoder.Token() if tok == nil { break } switch tp := tok.(type) { case xml.StartElement: if tp.Name.Local == "book" { // 将元素解码为struct var b Book decoder.DecodeElement(&b, &tp) books = append(books, b) } } } fmt.Println(books) }
$ go run xml.go [{XML Developer's Guide Gambardella, Matthew} {Visual Studio 7: A Comprehensive Guide Galos, Mike}]
原理
使用 xml
包的 NewDecoder
函数,可以创建XML内容的 Decoder
。
通过在 Decoder
上调用 Token
方法,接收 xml.Token
。 xml.Token
是保存令牌类型的接口。 可以根据类型定义代码的行为。 示例代码测试解析的 xml.StartElement
是否是 book
元素之一。 然后它将数据部分解析为 Book
结构。 这样, Decoder
中底层 Reader
中指针的位置被struct数据移位,并且解析可以继续。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- mybatis源码配置文件解析之三:解析typeAliases标签
- 安卓 so 文件解析详解
- perl解析pcap文件
- Nginx 源码:配置文件解析
- 要解析一个配置文件,当打开文件的时候我崩溃了
- 使用pdfminer解析pdf文件
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
算法分析导论(第2版)(英文版)
[美]Robert Sedgewick(罗伯特•塞奇威克)、[美]Philippe Flajolet(菲利普•弗拉若莱) / 电子工业出版社 / 2015-6 / 128.00元
《算法分析导论(第2版)(英文版)》全面介绍了算法的数学分析中所涉及的主要技术。涵盖的内容来自经典的数学课题(包括离散数学、初等实分析、组合数学),以及经典的计算机科学课题(包括算法和数据结构)。《算法分析导论(第2版)(英文版)》的重点是“平均情况”或“概率性”分析,书中也论述了“最差情况”或“复杂性”分析所需的基本数学工具。 《算法分析导论(第2版)(英文版)》第 1 版为行业内的经典著......一起来看看 《算法分析导论(第2版)(英文版)》 这本书的介绍吧!