ruby-on-rails – Rails v3 / Ruby 1.9.2中的字符编码问题

栏目: Ruby · 发布时间: 5年前

内容简介:翻译自:https://stackoverflow.com/questions/4697413/character-encoding-issue-in-rails-v3-ruby-1-9-2

当我从文件中读取内容时,有时会出现此错误“UTF-8中的无效字节序列”.注意 – 只有在字符串中有一些特殊字符时才会发生这种情况.我试过没有“r:UTF-8”打开文件,但仍然得到相同的错误.

open(file, "r:UTF-8").each_line { |line| puts line.strip(",") } # line.strip generates the error

文件内容:

# encoding: UTF-8
290919,"SE","26","Sk‰l","",59.4500,17.9500,, # this errors out
290956,"CZ","45","HornÌ Bradlo","",49.8000,15.7500,, # this errors out
290958,"NO","02","Svaland","",58.4000,8.0500,, # this works

这是我从外面获得的CSV文件,我正在尝试将其导入我的数据库,它顶部没有“#encoding:UTF-8”,但我添加了这个,因为我在某处读到它会解决这个问题,但事实并非如此.

环境:

> Rails v3.0.3

> ruby​​ 1.9.2p0(2010-08-18修订版29036)[x86_64-darwin10.5.0]

Ruby对每个文件都有一个外部编码和内部编码的概念.这允许您在源中使用UTF-8文件,即使文件以更深奥的格式存储.如果您的默认外部编码是UTF-8(如果您使用的是Mac OS X),那么您的所有文件I / O也将采用UTF-8.您可以使用File.open(‘file’).external_encoding来检查.打开文件并传递“r:UTF-8”时正在执行的操作是强制使用默认情况下 Ruby 正在使用的相同外部编码.

有可能,您的源文档不是UTF-8,而那些非ascii字符没有完全映射到UTF-8(如果是,您将获得正确的字符并且没​​有错误,如果它们映射不正确,你会得到不正确的字符,没有错误).你应该做的是尝试确定源文档的编码,然后让Ruby在读取时对文档进行转码,如下所示:

File.open(file, "r:windows-1251:utf-8").each_line { |line| puts line.strip(",") }

如果您需要帮助确定源的编码,请给 this Python library 一个旋转.它基于Seamonkey / Mozilla中的自动字符集检测回退(可能仍在Firefox中).

翻译自:https://stackoverflow.com/questions/4697413/character-encoding-issue-in-rails-v3-ruby-1-9-2


以上所述就是小编给大家介绍的《ruby-on-rails – Rails v3 / Ruby 1.9.2中的字符编码问题》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

程序员的思维修炼

程序员的思维修炼

Andy Hunt / 崔康 / 人民邮电出版社 / 2010-12-10 / 39.00元

本书解释了为什么软件开发是一种精神活动,思考如何解决问题,并就开发人员如何能更好地开发软件进行了评论。书中不仅给出了一些理论上的答案,同时提供了大量实践技术和窍门。 本书供各层次软件开发人员阅读。一起来看看 《程序员的思维修炼》 这本书的介绍吧!

JS 压缩/解压工具
JS 压缩/解压工具

在线压缩/解压 JS 代码

HTML 编码/解码
HTML 编码/解码

HTML 编码/解码

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具