技术分享 32 位 float 型的二进制存储 (32位浮点型数的二进制存储)

chasel · 2022-05-01 23:09:43 · 热度: 25

  • 1、(-1)^s 表示符号位,当 s=0,V 为正数;当 s=1,V 为负数
  • 2、M 表示有效数字,大于等于 1,小于 2。
  • 3、2^E 表示指数位。

举例来说,十进制的5.0,写成二进制是101.0,相当于1.01×2^2。那么,按照上面V的格式,可以得出 s=0,M=1.01,E=2。

IEEE 754 规定,对于 32 位的浮点数,最高的 1 位是符号位 s,接着的 8 位是指数 E,剩下的 23 位为有效数字 M。

IEEE 754 对有效数字M和指数E,还有一些特别规定。

前面说过,1≤ M <2,也就是说,M 可以写成 1.xxxxxx 的形式,其中 xxxxxx 表示小数部分。IEEE754 规定,在计算机内部保存 M 时,默认这个数的第一位总是 1,因此可以被舍去,只保存后面的 xxxxxx 部分。比如保存 1.01 的时候,只保存 01,等到读取的时候,再把第一位的1加上去。这样做的目的,是节省 1 位有效数字。以32位浮点数为例,留给 M 只有 23 位,将第一位的1舍去以后,等于可以保存 24 位有效数字。

至于指数 E,情况就比较复杂。

首先,E 为一个无符号整数(unsignedint)。这意味着,如果E为8位,它的取值范围为 0~255;如果 E 为 11 位,它的取值范围为 0~2047。但是,我们知道,科学计数法中的E是可以出现负数的,所以 IEEE754 规定,E 的真实值必须再减去一个中间数,对于 8 位的 E,这个中间数是 127;对于 11 位的E,这个中间数是 1023。

比如,2^10 的 E 是 10,所以保存成 32 位浮点数时,必须保存成 10+127=137,即 10001001。

然后,指数E还可以再分成三种情况:

  • (1)E不全为0或不全为1。这时,浮点数就采用上面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第一位的1。
  • (2)E 全为 0。这时,浮点数的指数 E 等于 1-127(或者 1-1023),有效数字 M 不再加上第一位的 1,而是还原为 0.xxxxxx 的小数。这样做是为了表示 ±0,以及接近于 0 的很小的数字。
  • (3)E 全为 1。这时,如果有效数字 M 全为 0,表示 ± 无穷大(正负取决于符号位 s);如果有效数字 M 不全为 0,表示这个数不是一个数(NaN)。
  • 注意:十进制小数入内存是极有可能失精度的比如 0.3 这哥们儿本身就无法转化为有限二进制表示。

猜你喜欢:
暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册