前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >深度剖析数据在内存中的存储

深度剖析数据在内存中的存储

作者头像
用户11369558
发布于 2024-11-20 06:58:50
发布于 2024-11-20 06:58:50
6100
代码可运行
举报
文章被收录于专栏:JavaJava
运行总次数:0
代码可运行

本篇文章我们来深度剖析数据在内存中的存储


1. 数据类型介绍

我们已经学习了基本的内置类型:

char //字符数据类型 short //短整型 int //整形 long //长整型 long long //更长的整形 float //单精度浮点数 double //双精度浮点数 //C语言有没有字符串类型?

以及他们所占存储空间的大小。 类型的意义: 1. 使用这个类型开辟内存空间的大小(大小决定了使用范围)。 2. 如何看待内存空间的视角


1.1 类型的基本归类:

整形家族:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
char
    unsigned char
    signed char
short
    unsigned short [int]
    signed short [int]
int
    unsigned int
    signed int
long
    unsigned long [int]
    signed long [int]

为什么表示字符的char类型也属于整形家族? 解析:字符在内存中存储的是ASCII值,ASCII码值是整形,所以字符类型也归纳为整形

signed int 和unsigned int 区别: 1.signed int 表示有符号的整形 2.unsigned int 表示无符号的整形 例子:char 1个字节 8个bit 11111111 看第一个数字0 如果是signed类型 0表示正数 1表示负数 -127 如果是unsigned char类型 那么每一位都是有效位 就是255 3. signed char 类型取值范围为 -127--128 unsigned char 取值范围为0--255

浮点数家族:

float double

构造类型:

> 数组类型 > 结构体类型 struct > 枚举类型 enum > 联合类型 union

指针类型:

int *pi; char *pc; float* pf; void* pv;

空类型: void 表示空类型(无类型) 通常应用于函数的返回类型、函数的参数、指针类型。


2. 整形在内存中的存储

我们之前讲过一个变量的创建是要在内存中开辟空间的。空间的大小是根据不同的类型而决定的。

那接下来我们谈谈数据在所开辟内存中到底是如何存储的?

比如:

int a = 20; int b = -10;

我们知道为 a 分配四个字节的空间。 那如何存储? 下来了解下面的概念:

2.1 原码、反码、补码

首先我们要知道 数据是以二进制的形式存储在计算机中的,并且计算机能够处理二进制的数据。 计算机中的整数有三种2进制表示方法,即原码、反码和补码。 三种表示方法均有符号位和数值位两部分,符号位都是用0表示“正”,用1表示“负”

正数的原、反、补码都相同。 负整数的三种表示方法各不相同。 原码 直接将数值按照正负数的形式翻译成二进制就可以得到原码。 反码 将原码的符号位不变,其他位依次按位取反就可以得到反码。 补码 反码+1就得到补码

例子:

由图就可见,内存中存储的反码,并且这是由小端存储

对于整形来说:数据存放内存中其实存放的是补码。

为什么呢? 在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统 一处理; 同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程 是相同的,不需要额外的硬件电路

2.2 大小端介绍

什么大端小端: 大端(存储)模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中; 小端(存储)模式,是指数据的低位保存在内存的低地址中,而数据的高位,,保存在内存的高地址中。

例:

为什么会有大小端模式之分呢? 这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8 bit。但是在C语言中除了8 bit的char之外,还有16 bit的short型,32 bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。 例如:一个 16bit 的 short 型 x ,在内存中的地址为 0x0010 , x 的值为 0x1122 ,那么 0x11 为高字节, 0x22 为低字节。对于大端模式,就将 0x11 放在低地址中,即 0x0010 中, 0x22 放在高地址中,即 0x0011 中。小端模式,刚好相反。我们常用的 X86 结构是小端模式,而 KEIL C51 则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。

百度2015年系统工程师笔试题:设计一个小程序来判断当前机器的字节序。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#include <stdio.h>
int check()
{
	int a = 1;
	//00000000 00000000 00000000 00000001
	// 0x00 00 00 01
	//
	return *(char*)(&a);
	//如果小端 1
	//大端 0
}
int main()
{
	int ret = check();
	if (ret == 1)
	{
		printf("小端");
	}
	else
	{
		printf("大端");
	}
}

3 练习

3.1

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
//输出什么?
#include <stdio.h>
int main()
{
  char a= -1;
  signed char b=-1;
  unsigned char c=-1;
  printf("a=%d,b=%d,c=%d",a,b,c);
  return 0;
}

解析: char a和signed char b一样 // -1 //原码:10000000 00000000 00000000 00000001 //反码:111111111 111111111 111111111 111111110 //补码:111111111 111111111 111111111 111111111 但因为是char类型,只有8个bit,所以要截断 //11111111 //%d 是10进制的形式打印有符号的整数 char a和signed char b补1 // 补码:111111111 111111111 111111111 111111111 打印的是原码,所以char a和signed char b打印的是-1 而unsigned char c是无符号类型 它补0 //00000000 00000000 00000000 111111111 //整数的原/反/补码相同 所以unsigned char c是255

3.2

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#include <stdio.h>
int main()
{
  char a = -128;
  printf("%u\n",a);
  return 0;
}

解析: char a=-128 // 原码:10000000 00000000 00000000 10000000 // 反码:11111111 11111111 11111111 01111111 // 补码:11111111 11111111 11111111 1000000 因为是char类型 所以 10000000 %u 是10进制的形式 打印无符号的整数 补0 //补码: 11111111 11111111 11111111 10000000 无符号数字原反补码相同


代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#include <stdio.h>
int main()
{
  char a = 128;
  printf("%u\n",a);
  return 0;
}

解析:跟上一题类似 char a=128 整数原反补相同 //原/反/补码: 00000000 00000000 00000000 10000000 得到的是10000000 %u打印的是10进制 无符号类型的整数 // 11111111 11111111 11111111 10000000

3.3

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#include <stdio.h>
int main(){
int i= -20;
unsigned  int  j = 10;
printf("%d\n", i+j);
}

解析:int i=-20; 原码:10000000 00000000 00000000 00010100 反码:11111111 11111111 11111111 11101011 补码:11111111 11111111 11111111 11101100 unsigned int j=10 原/反/补:00000000 00000000 00000000 00001010 然后相加 11111111 11111111 11111111 11110110 反码:11111111 11111111 11111111 11110101 原码:10000000 00000000 00000000 00001010 所以才是-10

3.4

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#include <stdio.h>
int main()
{
unsigned int i;
for(i = 9; i >= 0; i--)
{
  printf("%u\n",i);
}
}

unsigned int 没有负数 取值范围是0--2^31

3.5

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#include <stdio.h>
int main()
{
  char a[1000];
  int i;
  for(i=0; i<1000; i++)
 {
    a[i] = -1-i;
 }
  printf("%d",strlen(a));
  return 0;
}

解析:同理跟上题一样 strlen 统计的是\0之前的出现的字符的个数 -1 -2 -3...128 127...3 2 1 \0 char范围-127--128

3.6

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#include <stdio.h>
unsigned char i = 0;
int main()
{
  for(i = 0;i<=255;i++)
 {
    printf("hello world\n");
 }
  return 0;
}

解析:死循环 unsigned char取值范围 0--255


总结:

本章节只是较复杂,覆盖的很全面,非常适合深入探究,一定要自己手敲代码,并且自己去感受,当成复习资料也是很不错的

后期博主会陆续更新

如有不足之处欢迎补充交流

看到这里的友友们,支持一下博主,来个免费三连,感谢! ! !

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-11-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验