webSocket 二进制传输基础准备-Unicode转UTF16

栏目: 后端 · 发布时间: 6年前

内容简介:1.2.3.

前言

1. websocket 二进制数据传输基础准备工作

2. webSocket 二进制传输基础准备-Unicode转UTF8

3. webSocket 二进制传输基础准备-Unicode转UTF16

昨天我们学习了Unicode转UTF8

js中所有的string类型都是使用的UTF-16编码

下面就直接开始吧

完整的 Unicode 字符集

UTF-16编码方式

Unicode码范围 UTF-16编码方式 字节
U+0000 ~ U+FFFF 等于原值 2
U+10000 ~ U+10FFFF 将Unicode值减去0x10000,得到20位长的值。<br/>再将其分为高10位和低10位,分别为2个字节。<br/>高10位和低10位的范围都在 0 ~ 0x3FF<br/>高10位加0xD800,低十位加0xDC00 4

Unicode转UTF-16

今天使用 U+22222(大于U+10000) 进行转码UTF16

先进行减去0x10000
0x22222 - 0x10000 = 0x12222 =  1 0010 0010 0010 0010
转换二进制并且分割位高低10位
二进制1111111111 =  1023十进制
利用按位与的特性获取低10位
二进制1111111111  &  1 00100010 00100010 = 10 0010 0010
十进制1023 & 0x12222 =  546
低10位加0xDC00
546 + 0xDC00 =  56866 = 0xde22

利用带符号右移运算符以及按位与获取高10位

0x12222 << 10 = 72 = 1001000
1001000 & 1111111111 = 1001000
72 & 1023  = 72
高10位加0xD800
72 + 0xD800 = 55368 = 0xd848

U+22222编码转UTF-16 = [0xd848,0xde22]
var  str = "";
[0xd848,0xde22].forEach(item => {
    str +=String.fromCharCode(item)
})
console.log(str);

明天就是假期了,尽可能的做出UTF-16与UTF-8 的互转。

大概原理就是先将 字符 逆推转Unicode编码 然后再转你想要的编码格式


以上所述就是小编给大家介绍的《webSocket 二进制传输基础准备-Unicode转UTF16》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

浅薄

浅薄

[美] 尼古拉斯·卡尔 / 刘纯毅 / 中信出版社 / 2010-12 / 42.00元

《浅薄:互联网如何毒化了我们的大脑》在我们跟计算机越来越密不可分的过程中,我们越来越多的人生体验通过电脑屏幕上闪烁摇曳、虚无缥缈的符号完成,最大的危险就是我们即将开始丧失我们的人性,牺牲人之所以区别于机器的本质属性。——尼古拉斯•卡尔“谷歌在把我们变傻吗?”当尼古拉斯•卡尔在发表于《大西洋月刊》上赫赫有名的那篇封面文章中提出这个问题的时候,他就开启了人们热切渴望的期盼源泉,让人急于弄清楚互联网是在......一起来看看 《浅薄》 这本书的介绍吧!

在线进制转换器
在线进制转换器

各进制数互转换器

HTML 编码/解码
HTML 编码/解码

HTML 编码/解码