go基础库之读/写不同的字符集

栏目: Go · 发布时间: 7年前

内容简介:不同的输入源可以使用不同的字符集,用Go开发的应用中也不例外。现在许多用户都使用的Windows系统,当然也有其他的系统。默认情况下,Go希望程序中使用的字符编码都为UTF-8。如果不是,则必须对给定的字符集进行解码,以便能够正确处理字符串。本文将介绍非UTF-8的字符集如何进行文件读写。

不同的输入源可以使用不同的字符集,用 Go 开发的应用中也不例外。现在许多用户都使用的Windows系统,当然也有其他的系统。默认情况下,Go希望程序中使用的字符编码都为UTF-8。如果不是,则必须对给定的字符集进行解码,以便能够正确处理字符串。本文将介绍非UTF-8的字符集如何进行文件读写。

读/写不同的字符集

Golang 版本

1.12.1

前言

不同的输入源可以使用不同的字符集,用Go开发的应用中也不例外。现在许多用户都使用的Windows系统,当然也有其他的系统。默认情况下,Go希望程序中使用的字符编码都为UTF-8。如果不是,则必须对给定的字符集进行解码,以便能够正确处理字符串。本文将介绍非UTF-8的字符集如何进行文件读写。

实现

package main

import (
	"fmt"
	"golang.org/x/text/encoding/charmap"
	"io/ioutil"
	"os"
)

func main() {

	// 将字符串编码为Windows-1252并写入文件
	encoder := charmap.Windows1252.NewEncoder()
	s, e := encoder.String("This is sample text with runes Š")
	if e != nil {
		panic(e)
	}
	ioutil.WriteFile("example.txt", []byte(s), os.ModePerm)

	// 解码为UTF-8
	f, e := os.Open("example.txt")
	if e != nil {
		panic(e)
	}
	defer f.Close()
	decoder := charmap.Windows1252.NewDecoder()
	reader := decoder.Reader(f)
	b, err := ioutil.ReadAll(reader)
	if err != nil {
		panic(err)
	}
	fmt.Println(string(b))
}
$ go run main.go
This is sample text with runes Š

原理

golang.org/x/text/encoding/charmap 包中包含广泛使用的字符集的 Charmap 类型指针常量。 Charmap 类型提供了为给定字符集创建编码器和解码器的方法。 Encoder 创建编码 Writer ,它将写入的字节编码到所选的字符集。 类似地, Decoder 可以创建解码 Reader ,其将读取到的所有数据解码到所选的字符集。


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

数据挖掘技术

数据挖掘技术

[美]MichaelJ.A.B / 别荣芳、尹静、邓六爱 / 机械工业 / 2006-7 / 49.00元

本书是数据挖掘领域的经典著作,数年来畅销不衰。全书从技术和应用两个方面,全面、系统地介绍了数据挖掘的商业环境、数据挖掘技术及其在商业环境中的应用。自从1997年本书第1版出版以来,数据挖掘界发生了巨大的变化,其中的大部分核心算法仍然保持不变,但是算法嵌入的软件、应用算法的数据库以及用于解决的商业问题都有所演进。第2版展示如何利用基本的数据挖掘方法和技术,解决常见的商业问题。 本书涵盖核心的数......一起来看看 《数据挖掘技术》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

在线进制转换器
在线进制转换器

各进制数互转换器

URL 编码/解码
URL 编码/解码

URL 编码/解码