ruby-on-rails – Rails v3 / Ruby 1.9.2中的字符编码问题

栏目: Ruby · 发布时间: 5年前

内容简介:翻译自:https://stackoverflow.com/questions/4697413/character-encoding-issue-in-rails-v3-ruby-1-9-2

当我从文件中读取内容时,有时会出现此错误“UTF-8中的无效字节序列”.注意 – 只有在字符串中有一些特殊字符时才会发生这种情况.我试过没有“r:UTF-8”打开文件,但仍然得到相同的错误.

open(file, "r:UTF-8").each_line { |line| puts line.strip(",") } # line.strip generates the error

文件内容:

# encoding: UTF-8
290919,"SE","26","Sk‰l","",59.4500,17.9500,, # this errors out
290956,"CZ","45","HornÌ Bradlo","",49.8000,15.7500,, # this errors out
290958,"NO","02","Svaland","",58.4000,8.0500,, # this works

这是我从外面获得的CSV文件,我正在尝试将其导入我的数据库,它顶部没有“#encoding:UTF-8”,但我添加了这个,因为我在某处读到它会解决这个问题,但事实并非如此.

环境:

> Rails v3.0.3

> ruby​​ 1.9.2p0(2010-08-18修订版29036)[x86_64-darwin10.5.0]

Ruby对每个文件都有一个外部编码和内部编码的概念.这允许您在源中使用UTF-8文件,即使文件以更深奥的格式存储.如果您的默认外部编码是UTF-8(如果您使用的是Mac OS X),那么您的所有文件I / O也将采用UTF-8.您可以使用File.open(‘file’).external_encoding来检查.打开文件并传递“r:UTF-8”时正在执行的操作是强制使用默认情况下 Ruby 正在使用的相同外部编码.

有可能,您的源文档不是UTF-8,而那些非ascii字符没有完全映射到UTF-8(如果是,您将获得正确的字符并且没​​有错误,如果它们映射不正确,你会得到不正确的字符,没有错误).你应该做的是尝试确定源文档的编码,然后让Ruby在读取时对文档进行转码,如下所示:

File.open(file, "r:windows-1251:utf-8").each_line { |line| puts line.strip(",") }

如果您需要帮助确定源的编码,请给 this Python library 一个旋转.它基于Seamonkey / Mozilla中的自动字符集检测回退(可能仍在Firefox中).

翻译自:https://stackoverflow.com/questions/4697413/character-encoding-issue-in-rails-v3-ruby-1-9-2


以上所述就是小编给大家介绍的《ruby-on-rails – Rails v3 / Ruby 1.9.2中的字符编码问题》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

刘强东自述

刘强东自述

刘强东 / 中信出版集团 / 2016-6-1 / 49.00

京东 1998年,京东还只是中关村一个经营光磁生意的小柜台,月营业额仅有几万元,如今则已经成长为中国营收规模超大的互联网企业,2015年全年营收1813亿,总交易额达到4627亿元; 为解决电商“最后一公里”的痛点,创立并自建B2C物流模式; 经常被争议,却始终坚持“不挣快钱”,选择上市不是因为“缺钱”,只为让合作伙伴睡得着觉,为用户和社会创造价值,由此成就让整个华尔街一片京东红......一起来看看 《刘强东自述》 这本书的介绍吧!

SHA 加密
SHA 加密

SHA 加密工具

XML、JSON 在线转换
XML、JSON 在线转换

在线XML、JSON转换工具

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具