PostgreSQL 字符编码总结

栏目: 数据库 · 发布时间: 7年前

字符集可在 initdb、createdb、”create database” 时设定，每个数据库的字符集必须和 LC_CTYPE、LC_COLLATE 设置兼容，C 或 POSIX 区域兼容任意字符集，但其他区域只兼容一种字符集（在 Windows 上 UTF-8 编码可兼容任意区域）。

PostgreSQL 支持编码在服务端和前端之间的自动编码转换，也可以使用 SQL 命令创建一种编码转换。比如数据库使用了 EUC_JP 日文编码，但前端收到的是 UTF8 编码的数据，数据库内部会自动完成 UTF8 到 EUC_JP 的编码转换。

若数据库被设置为 SQL_ASCII 编码，字节值 [0, 127] 依据 ASCII 标准解释，[128, 255] 作为无法解析的字符，数据库不会做任何编码转换。也就是说，使用了非 ASCII 数据时，数据库不会转换编码，也不会校验非 ASCII 字符。

若客户端使用了 SQL_ASCII 编码发送 SQL 语句，那么数据库的自动编码转换会禁用，不管数据库的字符集是什么。

这种行为被允许但会被弃用：通过超级用户创建数据库，数据库编码为 SQL_ASCII，LC_CTYPE 不为 C 也不为 POSIX。

除非很明确地知道数据库内存入的数据都是 ASCII 数据，否则不建议将数据库编码设置为 SQL_ASCII ，也不建议客户端编码设置为 SQL_ASCII。

表格 Client/Server Character Set Conversions 显示了 PostgreSQL 支持的服务端/客户端的自动编码转换，比如数据库编码采用 EUC_JP，客户端可使用 EUC_JP、MULE_INTERNAL、SJIS、UTF8 编码，数据库内部就能够完成自动编码转换。若数据库采用 UTF8 编码，那么客户端使用任意编码都行。进一步地看，不管数据库使用什么编码，自动编码转换支持使用 UTF8 编码的客户端；不过有一个例外就是数据库采用 MULE_INTERNAL 编码，客户端使用 UTF8 时就无法做自动编码转换。

参考链接： Character Set Support

黑客简史：棱镜中的帝国

刘创 / 电子工业出版社 / 2015-1 / 39.80元

“黑客”，伴随着计算机和互联网而诞生，他们掌握着前沿的计算机和网络技术，能够发现并利用计算机系统和网络的弱点，他们的行为动机多样，因此我们必须对这一群体进行分解，认识他们及其技术的两面性——“黑客”中那些不断拓展技术边界、富于创造力的，和那些掌握技术、却利欲熏心的，就像硬币的两面，谁都无法清晰地辨别是非。相对于主流文化，黑客的行为方式和理念等形成了一种“亚文化”，与主流文化相互作用。一起来看看《黑客简史：棱镜中的帝国》这本书的介绍吧!

码农工具

PostgreSQL 字符编码总结

黑客简史：棱镜中的帝国

随机密码生成器

html转js在线工具

HSV CMYK 转换工具