NodeJs 系列：聊一聊 BOM

栏目: Node.js · 发布时间: 7年前

内容简介：最近在看Node源码的时候，偶然间，看到如下函数：对于函数的功能，注释写的很清楚了－用于清除字节序标识符（BOM）。对于BOM，相信大多数人对其即陌生又熟悉，我们在各大IDE中常常见到它的身影，但要真的把它解释清除，却有点力不从心。故此，笔者利用闲暇之余搜索资料整理成文，如果错漏，还望提点！

最近在看Node源码的时候，偶然间，看到如下函数：

对于函数的功能，注释写的很清楚了－用于清除字节序标识符（BOM）。

对于BOM，相信大多数人对其即陌生又熟悉，我们在各大IDE中常常见到它的身影，但要真的把它解释清除，却有点力不从心。故此，笔者利用闲暇之余搜索资料整理成文，如果错漏，还望提点！

字节序

在解释BOM之前，我们不得不提到字节序。

在古时，我们的很多书刊保有从左到右的排版的习惯。即使是今天，某些国家的文字读序依旧存在差异。计算机世界也是如此。

我们把多字节排练的顺序叫做字节序。

这里我们通过一个例子展开说明（本例来自：“字节序”是个什么鬼？）：

给定两个分别需要4个字节存储的整数，为了方便说明，使用16进制表示这两个数，即0x12345678和0x11223344。对于如何存储，有人提了两个方案：

方案一：

NodeJs 系列：聊一聊 BOM

方案二：

NodeJs 系列：聊一聊 BOM

对于方案一，高位字节在存储在高位地址，低位字节在低位地址，我们称之为大端（Big endian）字节序。方案二把低位字节在前，高位字节在后，我们把这种顺序叫做小端（Little endian）字节序。

BOM

对于人类而言，字节序也许并不是问题。比如从右往左读"字节序"，聪明如你们，会发现“序节字”根本语义不通，可以轻松的找到解决之道。但对于计算机而言，它不明白什么是语义，也没法联系上下文。它只能按照给定的指令去读取字节。如果是大端字节序，先读到的就是高位字节，后读到的就是低位字节。小端字节序正好相反。

所以对于计算机而言，我们需要一种方法去标识字节序，以防乱码的出现。BOM就是一种用于标识的unicode字符，它常被用来当做标示以UTF-8、UTF-16或UTF-32为编码的文件

对于UTF-16和UTF-32而言，因为他们分别使用2个字节和4个字节编码Unicode字符，对于多字节编码，BOM的存在显然很有必要。此时BOM被放置为文件或字符串流的第一个字符，如果标识符为 U+FFFE 则表示大端字节序，如果标识符为 U+FEFF 则表示小端字节序。

那既然BOM是用于标示字节序的，那为什么还要把它删除呢？这里就不得不提一下UTF-8了。

UTF-8是一种可变字节长度的编码方式（最小1字节，最大4字节），也就是说UTF-8可以根据数据大小来决定要存储的字节数。它的编码方式与其他两者不同，无需使用BOM。

UTF-8在首字节标识了字节的个数。如果首字节以0开头，则代表单字节编码，如果以110开头者表示该字节为两个字节中的第一个字节，以此类推。除了单字节外，多字节UTF-8码的后续字节均以10开头。

所以1～4字节UTF-8编码看起来是这样的：

So BOM 在UTF-8编码中是非必须的，在类Unix系统（大量使用文本文件，用于文件格式，用于进程间通信）中，这种做法（插入BOM）是不被建议采用，因为它会妨碍到如解译器脚本开头的Shebang等的正确处理，但是许多视窗程序（包含记事本）会需要添加字节顺序标记到UTF-8文件。

参考

https://zhuanlan.zhihu.com/p/21388517
https://www.guokr.com/blog/83367/
https://zhuanlan.zhihu.com/p/25442427
https://zh.wikipedia.org/wiki/%E4%BD%8D%E5%85%83%E7%B5%84%E9%A0%86%E5%BA%8F%E8%A8%98%E8%99%9F

NodeJs 系列：聊一聊 BOM

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

NodeJs 系列：聊一聊 BOM

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

CSS世界

张鑫旭 / 人民邮电出版社 / 2017-12 / CNY 69.00

本书从前端开发人员的需求出发，以“流”为线索，从结构、内容到美化装饰等方面，全面且深入地讲解前端开发人员必须了解和掌握的大量的CSS知识点。同时，作者结合多年的从业经验，通过大量的实战案例，详尽解析CSS的相关知识与常见问题。作者还为本书开发了专门的配套网站，进行实例展示、问题答疑。作为一本CSS深度学习的书，书中介绍大量许多前端开发人员都不知道的CSS知识点。通过阅读本书，读者会对CSS......一起来看看《CSS世界》这本书的介绍吧!

码农工具

NodeJs 系列：聊一聊 BOM

字节序

BOM

参考

CSS世界

SHA 加密

XML、JSON 在线转换

HEX CMYK 转换工具