ruby-on-rails – Rails v3 / Ruby 1.9.2中的字符编码问题

栏目: Ruby · 发布时间: 6年前

内容简介:翻译自:https://stackoverflow.com/questions/4697413/character-encoding-issue-in-rails-v3-ruby-1-9-2

当我从文件中读取内容时,有时会出现此错误“UTF-8中的无效字节序列”.注意 – 只有在字符串中有一些特殊字符时才会发生这种情况.我试过没有“r:UTF-8”打开文件,但仍然得到相同的错误.

open(file, "r:UTF-8").each_line { |line| puts line.strip(",") } # line.strip generates the error

文件内容:

# encoding: UTF-8
290919,"SE","26","Sk‰l","",59.4500,17.9500,, # this errors out
290956,"CZ","45","HornÌ Bradlo","",49.8000,15.7500,, # this errors out
290958,"NO","02","Svaland","",58.4000,8.0500,, # this works

这是我从外面获得的CSV文件,我正在尝试将其导入我的数据库,它顶部没有“#encoding:UTF-8”,但我添加了这个,因为我在某处读到它会解决这个问题,但事实并非如此.

环境:

> Rails v3.0.3

> ruby​​ 1.9.2p0(2010-08-18修订版29036)[x86_64-darwin10.5.0]

Ruby对每个文件都有一个外部编码和内部编码的概念.这允许您在源中使用UTF-8文件,即使文件以更深奥的格式存储.如果您的默认外部编码是UTF-8(如果您使用的是Mac OS X),那么您的所有文件I / O也将采用UTF-8.您可以使用File.open(‘file’).external_encoding来检查.打开文件并传递“r:UTF-8”时正在执行的操作是强制使用默认情况下 Ruby 正在使用的相同外部编码.

有可能,您的源文档不是UTF-8,而那些非ascii字符没有完全映射到UTF-8(如果是,您将获得正确的字符并且没​​有错误,如果它们映射不正确,你会得到不正确的字符,没有错误).你应该做的是尝试确定源文档的编码,然后让Ruby在读取时对文档进行转码,如下所示:

File.open(file, "r:windows-1251:utf-8").each_line { |line| puts line.strip(",") }

如果您需要帮助确定源的编码,请给 this Python library 一个旋转.它基于Seamonkey / Mozilla中的自动字符集检测回退(可能仍在Firefox中).

翻译自:https://stackoverflow.com/questions/4697413/character-encoding-issue-in-rails-v3-ruby-1-9-2


以上所述就是小编给大家介绍的《ruby-on-rails – Rails v3 / Ruby 1.9.2中的字符编码问题》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

CSS

CSS

David Sawyer McFarland / O'Reilly / 2006-08-24 / USD 34.99

Book Description Web site design has grown up. Unlike the old days, when designers cobbled together chunky HTML, bandwidth-hogging graphics, and a prayer to make their sites look good, Cascading St......一起来看看 《CSS》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

SHA 加密
SHA 加密

SHA 加密工具

RGB CMYK 转换工具
RGB CMYK 转换工具

RGB CMYK 互转工具