浮点记数是什么?
答案:1 悬赏:70 手机版
解决时间 2021-05-12 03:28
- 提问者网友:戎马万世
- 2021-05-11 05:03
浮点记数是什么?
最佳答案
- 五星知识达人网友:迟山
- 2021-05-11 05:43
浮点型简单讲就是实数的意思
浮点数在计算机中用以近似表示任意某个实数。具体的说,这个实数由一个整数或定点数(即尾数)乘以某个基数(计算机中通常是2)的整数次幂得到,这种表示方法类似于基数为10的科学记数法。
浮点计算是指浮点数参与的运算,这种运算通常伴随着因为无法精确表示而进行的近似或舍入。
一个浮点数a由两个数m和e来表示:a = m × be。在任意一个这样的系统中,我们选择一个基数b(记数系统的基)和精度p(即使用多少位来存储)。m(即尾数)是形如±d.ddd...ddd的p位数(每一位是一个介于0到b-1之间的整数,包括0和b-1)。如果m的第一位是非0整数,m称作规格化的。有一些描述使用一个单独的符号位(s 代表+或者-)来表示正负,这样m必须是正的。e是指数。
这种设计可以在某个固定长度的存储空间内表示定点数无法表示的更大范围的数。
例如,一个指数范围为±4的4位十进制浮点数可以用来表示43210,4.321或0.0004321,但是没有足够的精度来表示432.123和43212.3(必须近似为432.1和43210)。当然,实际使用的位数通常远大于4。
此外,浮点数表示法通常还包括一些特别的数值:+∞和 ∞(正负无穷大)以及NaN('Not a Number')。无穷大用于数太大而无法表示的时候,NaN则指示非法操作或者无法定义的结果。
大部份计算机采用二进制(b=2)的表示方法。位(bit)是衡量浮点数所需存储空间的单位,通常为32位或64位,分别被叫作单精度和双精度。有一些计算机提供更大的浮点数,例如英特尔公司的浮点运算单元Intel8087协处理器(以及其被集成进x86处理器中的后代产品)提供80位长的浮点数,用于存储浮点运算的中间结果。还有一些系统提供128位的浮点数
浮点数使用IEEE754浮点标准保存
以下内容需要知道二进制小数转换十进制计算方法和整数一样,都是对每一位用2的幂加权。
IEEE浮点标准用 V = (-1)^s * M * 2^E的形式表示
V就是值
符号(sign)s决定正负,对于0有特殊处理
有效数(significand)M是一个二进制小数,范围在1~2或0~1之间
指数(exponent)E是2的幂(可以是负数),对浮点数加权
浮点数划分成3个域
一个单独符号位编码s
k位指数域 exp = e(k-1)...e(1)e(0)编码指数E
n位小数域 frac = f(n-1)...f(1)f(0)编码有效数M,但被编码的值依赖于指数域是否为零。
在C/C++中的float下 s有1位,exp有k=8位,frac有n=23位,double变量下k=11,n=52
根据exp的值,编码分三种状况:
1.规格化值
最普遍的状况,当exp的位模式既不是全为0也不是全为1时,就都属于这种状况。此时,指数域解释为偏置形式,E = e-Bias(e减Bias),e是无符号数,而Bias是一个等于2^(k-1) -1的偏置值。由此产生了指数的取值范围,float: -126~127,double: -1022~1023
小数域解释为描述小数值f,在0~1之间,有效数定义为M = 1+f,这样隐含了开头的1,免费获得了一个额外的精度位
2.非规格化值
指数域全为0,就是非规格化的值,此时,指数值是 E = 1 - Bias(Bias定义同上),有效数的值是 M = f,没有开头的1。值得注意的是这种方法对0的表示。+0.0的浮点表示中,位模式全为0:符号位是0,指数域全0,小数域也是0。而-0.0只有符号位是1,其他全0
3.特殊值
指数域全为1,就是这类数。
当小数域全为0时,得到的值表示无穷,s=0正无穷,s=1负无穷。当这两个非常大的数相乘或对某数除以0可以得到溢出的结果。 当小数域非0时结果被称作NaN,即not a number。一些运算结果不能表示为无穷或实数,就返回NaN,例如对-1开根号。
数值举例:
以8位浮点举例,32位和64位的以此类推
0的表示: 位表示0 0000 000(符号位,指数位,小数位,下同), e=0,E=1-7=-6,f=0,M=0, V=0
最小的非规格化数:(不考虑负数)
位表示 0 0000 001 此时 e=0; E=-6; f= 1/8; M=1/8; V = 1/512
即 f = 0*2^(-1)+0*2^(-2)+0*2^(-3)
V = f * 2^E
最大的非规格化数
位表示0 0000 111 表示 7/512
最小的规格化数
位表示0 0001 000
e=1; E= e - Bias = 1-7=-6; f = 0; M = 1+f = 1
V= M * 2^E = 8/512
最大的规格化数
位表示0 1110 111
e=14; E= 14-7=7; f=7/8; M = 15/8; V = 240
对于双精度浮点
最小规格化数 2.2*10^-308 = 1*2^-1022
最大规格化数 1.8*10^308 = (2-epsilon)*2^1023
浮点数在计算机中用以近似表示任意某个实数。具体的说,这个实数由一个整数或定点数(即尾数)乘以某个基数(计算机中通常是2)的整数次幂得到,这种表示方法类似于基数为10的科学记数法。
浮点计算是指浮点数参与的运算,这种运算通常伴随着因为无法精确表示而进行的近似或舍入。
一个浮点数a由两个数m和e来表示:a = m × be。在任意一个这样的系统中,我们选择一个基数b(记数系统的基)和精度p(即使用多少位来存储)。m(即尾数)是形如±d.ddd...ddd的p位数(每一位是一个介于0到b-1之间的整数,包括0和b-1)。如果m的第一位是非0整数,m称作规格化的。有一些描述使用一个单独的符号位(s 代表+或者-)来表示正负,这样m必须是正的。e是指数。
这种设计可以在某个固定长度的存储空间内表示定点数无法表示的更大范围的数。
例如,一个指数范围为±4的4位十进制浮点数可以用来表示43210,4.321或0.0004321,但是没有足够的精度来表示432.123和43212.3(必须近似为432.1和43210)。当然,实际使用的位数通常远大于4。
此外,浮点数表示法通常还包括一些特别的数值:+∞和 ∞(正负无穷大)以及NaN('Not a Number')。无穷大用于数太大而无法表示的时候,NaN则指示非法操作或者无法定义的结果。
大部份计算机采用二进制(b=2)的表示方法。位(bit)是衡量浮点数所需存储空间的单位,通常为32位或64位,分别被叫作单精度和双精度。有一些计算机提供更大的浮点数,例如英特尔公司的浮点运算单元Intel8087协处理器(以及其被集成进x86处理器中的后代产品)提供80位长的浮点数,用于存储浮点运算的中间结果。还有一些系统提供128位的浮点数
浮点数使用IEEE754浮点标准保存
以下内容需要知道二进制小数转换十进制计算方法和整数一样,都是对每一位用2的幂加权。
IEEE浮点标准用 V = (-1)^s * M * 2^E的形式表示
V就是值
符号(sign)s决定正负,对于0有特殊处理
有效数(significand)M是一个二进制小数,范围在1~2或0~1之间
指数(exponent)E是2的幂(可以是负数),对浮点数加权
浮点数划分成3个域
一个单独符号位编码s
k位指数域 exp = e(k-1)...e(1)e(0)编码指数E
n位小数域 frac = f(n-1)...f(1)f(0)编码有效数M,但被编码的值依赖于指数域是否为零。
在C/C++中的float下 s有1位,exp有k=8位,frac有n=23位,double变量下k=11,n=52
根据exp的值,编码分三种状况:
1.规格化值
最普遍的状况,当exp的位模式既不是全为0也不是全为1时,就都属于这种状况。此时,指数域解释为偏置形式,E = e-Bias(e减Bias),e是无符号数,而Bias是一个等于2^(k-1) -1的偏置值。由此产生了指数的取值范围,float: -126~127,double: -1022~1023
小数域解释为描述小数值f,在0~1之间,有效数定义为M = 1+f,这样隐含了开头的1,免费获得了一个额外的精度位
2.非规格化值
指数域全为0,就是非规格化的值,此时,指数值是 E = 1 - Bias(Bias定义同上),有效数的值是 M = f,没有开头的1。值得注意的是这种方法对0的表示。+0.0的浮点表示中,位模式全为0:符号位是0,指数域全0,小数域也是0。而-0.0只有符号位是1,其他全0
3.特殊值
指数域全为1,就是这类数。
当小数域全为0时,得到的值表示无穷,s=0正无穷,s=1负无穷。当这两个非常大的数相乘或对某数除以0可以得到溢出的结果。 当小数域非0时结果被称作NaN,即not a number。一些运算结果不能表示为无穷或实数,就返回NaN,例如对-1开根号。
数值举例:
以8位浮点举例,32位和64位的以此类推
0的表示: 位表示0 0000 000(符号位,指数位,小数位,下同), e=0,E=1-7=-6,f=0,M=0, V=0
最小的非规格化数:(不考虑负数)
位表示 0 0000 001 此时 e=0; E=-6; f= 1/8; M=1/8; V = 1/512
即 f = 0*2^(-1)+0*2^(-2)+0*2^(-3)
V = f * 2^E
最大的非规格化数
位表示0 0000 111 表示 7/512
最小的规格化数
位表示0 0001 000
e=1; E= e - Bias = 1-7=-6; f = 0; M = 1+f = 1
V= M * 2^E = 8/512
最大的规格化数
位表示0 1110 111
e=14; E= 14-7=7; f=7/8; M = 15/8; V = 240
对于双精度浮点
最小规格化数 2.2*10^-308 = 1*2^-1022
最大规格化数 1.8*10^308 = (2-epsilon)*2^1023
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
推荐资讯