前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >整型之韵,数之舞:大小端与浮点数的内存之旅

整型之韵,数之舞:大小端与浮点数的内存之旅

作者头像
秋邱
发布2024-10-09 20:16:16
960
发布2024-10-09 20:16:16
举报
文章被收录于专栏:笔记

1.0 整形提升

我们先来看看代码。

代码语言:javascript
复制
int main()
{
	char a = 3;
	char b = 127;
	char c = a + b;
	pritnf("%d", c);
	return 0;
}

这是char类型的相加,但你以为答案是130,那就是错了,事实没那么简单。

1.1 什么是整形提升

C语⾔中整型算术运算总是⾄少以缺省整型类型的精度来进⾏的。 为了获得这个精度,表达式中的字符和短整型操作数在使⽤之前被转换为普通整型,这种转换称为 型提升。

1.2 如何整形提升?

规则:

  1. 有符号整数提升是按照变量的数据类型的符号位来提升的
  2. ⽆符号整数提升,⾼位补0

打印结果:

-126

分析

代码语言:javascript
复制
	char a = 3;
	00000000000000000000000000000011  //3的二进制
	00000011 char a
	char b = 127;
	00000000000000000000000001111111  //127的二进制
	01000000 char b
	char c = a + b;
	00000011 char a
	01000000 char b  //这里还不能直接相加,要对a和b进行整形提升
    //在vs下char是有符号的char,所以对char a进行整形的提升,符号位是0
	00000000000000000000000000000011 //char a的整形提升
	//同理,char b也是有符号的char,符号位是0
	00000000000000000000000001111111 //char b的整形提升
	00000000000000000000000010000010 //a + b,d但是char c中只能存放8个比特位
	10000010 //char c
	printf("%d", c);//%d是按十进制打印有符号的整数,但我们是char c,所以需要进行整形提升
	//char c是有符号数,最高位是1全补1.
	11111111111111111111111110000010 //char c整形提升的结果(补码)
	//打印的方式是原码,我们要对c补码进行,取反+1
	00000000000000000000000001111110 //原码
	//结果是-127

1.3 整形提升的意义

表达式的整型运算要在CPU的相应运算器件内执⾏,CPU内整型运算器(ALU)的操作数的字节⻓度⼀般就是int的字节⻓度,同时也是CPU的通⽤寄存器的⻓度。因此,即使两个char类型的相加,在CPU执⾏时实际上也要先转换为CPU内整型操作数的标准⻓ 度。 通⽤CPU(general-purposeCPU)是难以直接实现两个8⽐特字节直接相加运算(虽然机器指令中可能有这种字节相加指令)。所以,表达式中各种⻓度可能⼩于int⻓度的整型值,都必须先转换为 int或unsigned int,然后才能送⼊CPU去执⾏运算。

也就是说,小于整形的类型就要进行提升。

注意:char的是unsigned char 还是 signed char ,这是不确定的,而是取决于编译器。 但常见的编译器上char 一般都是signed char。

2.0 算术转换

如果某个操作符的各个操作数属于不同的类型,那么除⾮其中⼀个操作数的转换为另⼀个操作数的类 型,否则操作就⽆法进⾏。下⾯的层次体系称为寻常算术转换。

long double double float unsigned long int long int unsigned int int

如果某个操作数的类型在上⾯这个列表中排名靠后,那么⾸先要转换为另外⼀个操作数的类型后执⾏ 运算。

3.0 大小端

3.1 什么是大小端

大端小端是计算机存储数据的一种方式。在内存中,数据被分割为多个字节进行存储。大小端指的是字节的存储顺序。

大端存储是指高位字节被存储在低位地址,低位字节存储在高位地址。大端存储方式常用于网络协议中。

小端存储是指低位字节被存储在低位地址,高位字节存储在高位地址。小端存储方式常用于x86架构的计算机。

我们在vs2022提示可知,vs2022中采用的是小端存储的方式。

图示:

接下里我们用程序来判断vs2022里的是大端还是小端。

3.2 判断大小端

3.2.1指针判断
代码语言:javascript
复制
#include<stdio.h>
int check_sys()
{
	int i = 1;
	return *(char*)&i;

}
int main()
{
	int ret = check_sys();
	if (ret == 1)
	{
		printf("小端");
	}
	else
	{
		printf("大端");
	}
	return 0;
}
3.2.2联合体判断
代码语言:javascript
复制
int check_sys()
{
	union check {
		char j;
		int i;
	};
	union check u = { 0 };
	u.j = 1;
	return u.j;

}
int main()
{
	int ret = check_sys();
	if (ret == 1)
	{
		printf("小端");
	}
	else
	{
		printf("大端");
	}
	return 0;
}

打印结果:

小端

3.3大小端的意义

我们知道了大小端,然后有什么用呢?

  1. 确保数据传输的准确性:在不同系统或设备之间进行数据交换时,了解大小端可以确保数据被正确解释。
  2. 兼容不同的系统:有助于软件在各种平台上的移植和运行。
  3. 优化性能:根据大小端特点进行针对性的优化。
  4. 调试和排错:当出现数据解析问题时,能更快地定位问题。
  5. 理解系统架构:加深对计算机系统内部工作原理的理解。
  6. 网络通信:确保网络协议的正确实现和数据的无误传输。
  7. 硬件设计:对硬件设计和开发具有指导意义。
  8. 数据恢复:在数据恢复过程中,正确解读存储的数据。
  9. 提高编程效率:避免因大小端问题导致的错误。
  10. 增强系统安全性:防止因数据解读错误引发的安全漏洞。

两种存储方式的区别在于字节的存储顺序,对于单个字节的操作没有影响,但对于多个字节的数据,如整数和浮点数,字节顺序的不同会导致数据的解释和处理方式不同。因此,当不同大小端的计算机之间进行数据传输时,需要进行字节序的转换。

4.0浮点数在内存中的存储

浮点数在内存中的存储是怎么样的呢,跟整形的存储一样吗?答案:不是!接下里往下看。

4.1 浮点数的存储

根据国际标准IEEE(电⽓和电⼦⼯程协会)754,任意⼀个⼆进制浮点数V可以表⽰成下⾯的形式:

V = (−1) ^S*M *2^E • (-1)^S 表⽰符号位,当S=0,V为正数;当S=1,V为负数 • M表⽰有效数字,M是⼤于等于1,⼩于2的 • 表⽰指数位

二进制对应的十进制图

举例 ⼗进制的5.0,写成⼆进制是101.0 ,相当于1.01×2^2 。 那么,按照上⾯V的格式,可以得出S=0,M=1.01,E=2。 ⼗进制的-5.0,写成⼆进制是-101.0 ,相当于-1.01×2^2 。那么,S=1,M=1.01,E=2。 IEEE 754规定: 对于32位的浮点数,最⾼的1位存储符号位S,接着的8位存储指数E,剩下的23位存储有效数字M对于64位的浮点数,最⾼的1位存储符号位S,接着的11位存储指数E,剩下的52位存储有效数字M。

float类型浮点数内存分配 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/1b0c0e99b9084031924925b93dc6b415.png) double类型浮点数内存分配 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/6cf9f51a9a614d388262edfa1a31cc8b.png)

4.2 浮点数存的过程

IEEE 754对有效数字M和指数E,还有⼀些特别规定。 对于M 1≤M<2 ,也就是说,M可以写成1.xxxxxx 的形式,其中xxxxxx 表⽰⼩数部分。IEEE 754规定,在计算机内部保存M时,默认这个数的第⼀位总是1,因此可以被舍去,只保存后⾯的xxxxxx部分。⽐如保存1.01的时候,只保存01,等到读取的时候,再把第⼀位的1加上去。这样做的⽬的,是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第⼀位的1舍去以后,等于可以保存24位有效数字。 对于E ,E为⼀个⽆符号整数(unsignedint) 这意味着,如果E为8位,它的取值范围为0255;如果E为11位,它的取值范围为02047。但是,我们知道,科学计数法中的E是可以出现负数的,所以IEEE754规定,存⼊内存时E的真实值必须再加上⼀个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间数是1023。⽐如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。

4.3 浮点数取的过程

指数E取出内存,情况有三。 1.E不全为0或不全为1 这时,浮点数就采⽤下⾯的规则表⽰,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第⼀位的1。 ⽐如:0.5的⼆进制形式为0.1,由于规定正数部分必须为1,即将⼩数点右移1位,则为1.0*2^(-1),其阶码为-1+127(中间值)=126,表⽰为01111110,⽽尾数1.0去掉整数部分为0,补⻬0到23位00000000000000000000000,则其⼆进制表⽰形式为:

代码语言:javascript
复制
 0 01111110 00000000000000000000000

2.E全为0

这时,浮点数的指数E等于1-127(或者1-1023)即为真实值,有效数字M不再加上第⼀位的1,⽽是还原为0.xxxxxx的⼩数。这样做是为了表⽰±0,以及接近于0的很⼩的数字。

代码语言:javascript
复制
0 00000000 00100000000000000000000

3.E全为1 这时,如果有效数字M全为0,表⽰±⽆穷⼤(正负取决于符号位s);

代码语言:javascript
复制
0 11111111 00010000000000000000000

这一篇到这里就完结了,感谢各位的观看。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-04-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.0 整形提升
    • 1.1 什么是整形提升
      • 1.2 如何整形提升?
        • 1.3 整形提升的意义
        • 2.0 算术转换
        • 3.0 大小端
          • 3.1 什么是大小端
            • 3.2 判断大小端
              • 3.2.1指针判断
              • 3.2.2联合体判断
            • 3.3大小端的意义
            • 4.0浮点数在内存中的存储
              • 4.1 浮点数的存储
                • 4.2 浮点数存的过程
                  • 4.3 浮点数取的过程
                  相关产品与服务
                  对象存储
                  对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
                  领券
                  问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档