N=M × RE
比如: 2.3456=2.3456×101, 其中M(Mantissa):浮点数的 尾数 ,R(Radix):阶码的 基数 ,E(Exponent):阶的 阶码 。
其中,R在计算机中通过用2,8或16表示,是个不确定的常量。
因此,在已知标准下,要表示浮点数,
一是要给出尾数M的值,通常用定点小数形式表示,它决定了浮点数的表示精度,即可以给出的有效数字的位数。
二是要给出阶码,通常用定点整数形式表示,它指出的是小数点在数据中的位置,决定了浮点数的表示范围。因此,在计算机中,浮点数通常被表示成如下格式:(假定为32位浮点数,基为2,其中最高位为符号位)
尾数的最高位始终是1,因此我们完全可以省略掉该位。比如(−1)(1)×(1+0.1110 0000 0000 0000 0000 000)×2128−127 中这个1在二进制中表示就会被省略。
至此,我们引入IEEE754 标准,该标准约束了浮点数的大部分使用设置:(尾数用原码;阶码用“移码”;基为2)
1:尾数用原码,且隐藏尾数最高位。
原码非0值浮点数的尾数数值最高位必定为 1,因此可以忽略掉该位,这样用同样多的位数就能多存一位二进制数,有利于提高数据表示精度,称这种处理方案使用了隐藏位技术。当然,在取回这样的浮点数到运算器执行运算时,必须先恢复该隐藏位。
2:阶码使用“移码”,基固定为2
浮点型数据定义浮点型数据分为 浮点型常量和浮点型变量
浮点型常量
实型也称为浮点型。实型常量也称为实数或者浮点数。在C语言中,实数只采用十进制。它有二种形式: 十进制数形式指数形式。
数据介绍
1.十进制数形式
由数码0~ 9和小数点组成。例如:0.0,.25,5.789,0.13,5.0,300.,-267.8230等均为合法的实数。
2.指数形式
由十进制数,加阶码标志“e”或“E”以及阶码(只能为整数,可以带符号)组成。其一般形式为a E n (a为十进制数,n为十进制整数)其值为 a*10,n 如: 2.1E5 (等于2.1*10的5次方), 3.7E-2 (等于3.7*10的-2次方) 0.5E7 (等于0.5*10的7次方), -2.8E-2 (等于-2.8*10的-2次方),以下不是合法的实数 345 (无小数点) E7 (阶码标志E之前无数字) -5 (无阶码标志) 53.-E3 (负号位置不对) 2.7E (无阶码)
标准C允许浮点数使用后缀。后缀为“f”或“F”即表示该数为浮点数。如356f。例2.2说明了这种情况:
void main()
{
printf("%f\n%f\n",356.,356f)
}
void 指明main不返回任何值 利用printf显示结果 结束
浮点型变量:
实型变量分为两类:单精度型和双精度型,
其类型说明符为float 单精度说明符,double 双精度说明符。在Turbo C中单精度型占4个字节(32位)内存空间,其数值范围为3.4E-38~3.4E+38,只能提供七位有效数字。双精度型占8 个字节(64位)内存空间,其数值范围为1.7E-308~1.7E+308,可提供16位有效数字。
实型变量说明的格式和书写规则与整型相同。
例如: float x,y(x,y为单精度实型量)
double a,b,c(a,b,c为双精度实型量)
实型常数不分单、双精度,都按双精度double型处理。
相互转换
IEEE754标准中浮点数表示格式IEEE规定的浮点数表示法是一种科学计数法,用符号(正或负)、指数和尾数来表示,底数被确定为2。也就是说浮点数被表示为尾数乘以2的指数次方再带上符号。
下面以单精度浮点数为例来介绍浮点数的三个区域:
符号域:符号域占1位,0表示正数,1表示负数。指数域:指数域共有8位,可表达的范围为:0~255。为能处理负指数,实际指数位存储在指数域中值减去一个偏移量(单精度为127,双精度为1023)。单精度浮点数的偏移量为127,故实际可表达的指数值的范围为-127~128。尾数域:尾数域共有23位。由于规范浮点数的小数点左侧必须为1,所以在保存尾数时,可以省略小数点前面这个1,从而腾出一个二进制位来保存更多的尾数。举例:比如对于单精度数而言,二进制的1001.101(对应于十进制的9.625)可以表达为1.001101 ×2^3,所以实际保存在尾数域中的
值为0011 0100 0000 0000 0000 000,即去掉小数点左侧的1,并用0 在右侧补齐。
(
整数部分(9)的计算:1001
小数部分(0.625)的计算:
0.625*2=1.25--------1
0.25 *2=0.5 ----------0
0.5 *2=1.0 -----------1
所以用二进制科学表示方式为:1.001101*2^3
)
实数与浮点数之间的变换举例例一:已知一个单精度浮点数用16进制数表示为:0xC0B40000,求此浮点数所表达的实数。
先转换为二进制形式(注意:对于负数二进制补码转换成十进制一定要:先取反,后加1)
C 0 B 4 0 0 0 0
1100 0000 1011 0100 0000 0000 0000 0000
按照浮点数格式切割成相应的域 1 1000 0001 01101 000000000000000000
经分析:符号域1 意味着负数;指数域为129 意味着实际的指数为2 (减去偏差值127);尾数域为01101 意味着实际的二进制尾数为1.01101 (加上隐含的小数点前面的1)。所以,实际的实数为:
= -1.01101 × 2^ 2=- ( 1*2^0 + 1*2^(-2) + 1*2^(-3) + 1*2^(-5) ) × 2^2
= -(1+0.25+0.125+0.03125)*4
= -1.40625*4
= -5.625
例二:将实数-9.625变换为相应的浮点数格式。
1) 求出该实数对应的二进制:1001.101,用科学技术法表达为:-1.001101 ×2^3;
2) 因为负数,符号为1;
3) 指数为3,故指数域的值为3 + 127 = 130,即二进制的10000010;
4) 尾数为1.001101,省略小数点左边的1后为001101,右侧0补齐,补够23位,
最终尾数域为:00110100000000000000000;
5) 最终结果:1 10000010 00110100000000000000000,用16进制表示:0xC11A0000。
float数据类型是浮点型数据类型。
浮点数在机内用指数形式表示,分解为:数符,尾数,指数符,指数四部分。数符占1位二进制,表示数的正负。指数符占1位二进制,表示指数的正负。
尾数表示浮点数有效数字,0.xxxxxxx,但不存开头的0和点。指数存指数的有效数字。指数占多少位,尾数占多少位,由计算机系统决定。
float在内存中的存储遵循IEEE 754标准。在C/C++中,float类型占4个字节即32位 , 这32位分成了3部分:符号位:转化成二进制后,第31位。 0代表正数,1代表负数。
阶码:30-23位,转化成规格化的二进制之后与127之和。
尾数:22-0位。
例如:13.625在内存中的存储,首先将13.625转化成二进制,整数部分除2取余,直到商为0停止 。最后读数时,从最后一个余数读起,一直到最前面的一个余数。