go基础库之解码非Unicode字符集中的字符串

栏目: Go · 发布时间: 4年前

内容简介:一个鲜为人知的事实是在处理非Unicode字符串时,需要将内容转换为Unicode。本篇将演示如何解码和编码非unicode字符串。

一个鲜为人知的事实是 .go 文件中的所有内容都是用UTF-8编码的。信不信由你,Unicode不是世界上唯一的字符集。例如,Windows-1250编码在Windows用户中广泛使用。

在处理非Unicode字符串时,需要将内容转换为Unicode。本篇将演示如何解码和编码非unicode字符串。

解码非Unicode字符集中的字符串

Golang 版本

1.12.1

前言

一个鲜为人知的事实是 .go 文件中的所有内容都是用UTF-8编码的。信不信由你,Unicode不是世界上唯一的字符集。例如,Windows-1250编码在Windows用户中广泛使用。

在处理非Unicode字符串时,需要将内容转换为Unicode。本篇将演示如何解码和编码非unicode字符串。

实现

  1. 创建文件 encode.go ,代码如下:
package main

import (
	"io"
	"os"

	"golang.org/x/text/encoding/charmap"
)

func main() {

	f, err := os.OpenFile("out.txt", os.O_CREATE|os.O_RDWR,
		os.ModePerm|os.ModeAppend)
	if err != nil {
		panic(err)
	}
	defer f.Close()

	// 解码unicode
	encoder := charmap.Windows1250.NewEncoder()
	writer := encoder.Writer(f)
	io.WriteString(writer, "Gdańsk")

}

运行 go run encode.go

out.txt 以Windows-1250编码进行编码

  1. 创建文件 decode.go ,代码如下:
package main

import (
	"fmt"
	"io/ioutil"
	"os"
	"strings"

	"golang.org/x/text/encoding/charmap"
)

func main() {

	// 打开 windows-1250 文件
	f, err := os.Open("out.txt")
	if err != nil {
		panic(err)
	}
	defer f.Close()

	// 全部以原始内容读入
	b, err := ioutil.ReadAll(f)
	if err != nil {
		panic(err)
	}
	content := string(b)

	fmt.Println("Without decode: " + content)

	// unicode 解码
	decoder := charmap.Windows1250.NewDecoder()
	reader := decoder.Reader(strings.NewReader(content))
	b, err = ioutil.ReadAll(reader)
	if err != nil {
		panic(err)
	}
	fmt.Println("Decoded: " + string(b))

}
$ go run decode.go
Without decode: Gda�sk
Decoded: Gdańsk

原理

软件包 golang.org/x/text/encoding/charmap 包含用于简单编码和解码的 Charset 类型。该类型实现创建解码器结构的 NewDecoder 方法。

编码工作类似。创建编码 Writer ,然后将由该 Writer 编写的每个字符串编码为Windows-1250编码。

注意,选择Windows-1250作为示例。这个包 golang.org/x/text/encoding/charmap 包含许多其他字符集选项。


以上所述就是小编给大家介绍的《go基础库之解码非Unicode字符集中的字符串》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

数论概论

数论概论

希尔弗曼 / 孙智伟 / 机械工业出版社 / 2008-5 / 42.00元

《数论概论(原书第3版)》讲述了有关数论大量有趣的知识,以及数论的一般方法和应用,循序渐进地启发读者用数学方法思考问题,此外还介绍了目前数论研究的某些前沿课题。《数论概论(原书第3版)》采用轻松的写作风格,引领读者进入美妙的数论世界,不断激发读者的好奇心,并通过一些精心设计的练习来培养读者的探索精神与创新能力。一起来看看 《数论概论》 这本书的介绍吧!

JS 压缩/解压工具
JS 压缩/解压工具

在线压缩/解压 JS 代码

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换