最近做的项目都涉及了协议,网络编程,针对协议与网络通信数据传输,大家使用抓包工具抓出来的数据例如:0x5634... 这些就是所谓的网络字节序,俗称大端!而针对不同的机器,有着不同的模式,有些是大端,有些是小端,如果在网络传输中发送的是原数据0x3456,而不是0x5634,那么会发生灾难性的错误,因此需要在发送前调用htons或者htonl函数将其转换为大端模式,也就是网络字节序,相信在深入理解一些开源的项目中,底层用C/C++ 写的程序中,大家会看到这些函数。
另外,在面试过程中,这个点也非常的重要,通常会考察这些概念与碰到的问题之类的,那么下面一起来从零学起。
简化一下需求:
(1)WORD类型传输约定:先传递高八位,再传递低八位。
(2)DWORD传递约定:先传递高24位,然后传递高16位,再传递高八位,最后传递低八位
针对这样的类型如何传输呢?
下面看完本篇文章就知道怎么传输了!
所谓的大端模式,就是高位字节排放在内存的低地址端,低位字节排放在内存的高地址端。
所谓的小端模式,就是低位字节排放在内存的低地址端,高位字节排放在内存的高地址端。
简单来说:大端——高尾端,小端——低尾端。
实际例子如下:
16bit宽的数0x1234在Little-endian模式(以及Big-endian模式)CPU内存中的存放方式(假设从地址0x6411开始存放)为:
内存地址 | 小端模式存放内容 | 大端模式存放内容 |
---|---|---|
0x6410 | 0x34 | 0x12 |
0x6411 | 0x12 | 0x34 |
32bit宽的数0x12345678在Little-endian模式(以及Big-endian模式)CPU内存中的存放方式(假设从地址0x6411开始存放)为:
内存地址 | 小端模式存放内容 | 大端模式存放内容 |
---|---|---|
0x6410 | 0x78 | 0x12 |
0x6411 | 0x56 | 0x34 |
0x6412 | 0x34 | 0x56 |
0x6413 | 0x12 | 0x78 |
上面阐述了如何判断大端与小端,那如何来判断自己的CPU是大端还是小端。
下面给出了两种方法。
方法1:使用联合体,给一个变量赋值,使用另一个变量查看低地址存储的是高位还是低位。
方法2:直接查看char的低地址存储的是高位还是低位。
/**
* 检查机器的字节序
* @return
*/
bool isBigEndian() {
// 使用联合体
union node {
int num;
char ch;
};
union node p;
//方法一
p.num = 0x12345678;
// 低位地址存储低位
if (p.ch == 0x78) {
printf("Little endian\n");
} else {
// 低位地址存储高位
printf("Big endian\n");
}
//方法二
int num = 0x12345678;
char *q = (char *)#
if (*q == 0x78) {
printf("Little endian\n");
} else {
printf("Big endian\n");
}
}
运行结果:
=========两种方式验证机器大端还是小端==========
Little endian
Little endian
那如何自己实现小端转大端(网络字节序列)呢?
分为两种,一种是16位,一种是32位。
针对16位,实现如下:
/**
* 低地址存放高位,高地址存放低位
* WORD类型传输约定:先传递高八位,再传递低八位。
* 其中WORD 被定义为uint16_t
* 2字节大端转换函数
* @param value
* @param buf
* @return
*/
WORD EndianSwap16(const WORD &value, unsigned char* buf = NULL) {
assert(sizeof(value) == 2);
if(buf) {
*buf++ = value&0x00ff;
*buf = (value&0xff00)>>8;
}
return (value&0x00ff)<<8|(value&0xff00)>>8;
}
其中buf存储的是大端的每一个字节。
调用上述函数:
cout<<"==========调用自己实现的函数实现小端转换为大端=========="<<endl;
uint16_t a = 0x1234;
unsigned char buf[2];
printf("16位小端--->大端:%x\n", EndianSwap16(a, buf));
输出结果:
==========调用自己实现的函数实现小端转换为大端==========
16位小端--->大端:3412
34 12
针对32位:实现如下:
/**
* 低地址存放高位,高地址存放低位
* DWORD传递约定:先传递高24位,然后传递高16位,再传递高八位,最后传递低八位
* 4字节大端转换函数
* 其中DWORD 被定义为uint32_t
* @param value
* @param buf
* @return
*/
DWORD EndianSwap32(const DWORD &value, unsigned char* buf=NULL) {
assert(sizeof(value) == 4);
if(buf) {
*buf++ = value&0x000000ff;
*buf++ = (value&0x0000ff00)>>8;
*buf++ = (value&0x00ff0000)>>16;
*buf = value>>24;
}
return ((value >> 24) |
((value & 0x00ff0000) >> 8) |
((value & 0x0000ff00) << 8) |
(value << 24));
}
其中buf存储的是大端的每一个字节。
调用上述函数:
uint32_t b = 0x12345678;
unsigned char buf1[4];
printf("32位小端--->大端:%x\n", EndianSwap32(b, buf1));
printf("%x %x %x %x\n", buf1[0], buf1[1], buf1[2], buf1[3]);
输出结果:
==================================================
32位小端--->大端:78563412
78 56 34 12
在C/C++网络开发中可以通过引入
#include <netinet/in.h>
调用htonl
、htons
、ntohl
、 ntohs
来完成小端与大端转换。
那么下面来使用一下,使用之前先阐述一下这几个函数:
htonl()
32位无符号整型的主机字节顺序到网络字节顺序的转换(小端->大端)
htons()
16位无符号短整型的主机字节顺序到网络字节顺序的转换 (小端->大端)
ntohl()
32位无符号整型的网络字节顺序到主机字节顺序的转换 (大端->小端)
ntohs()
16位无符号短整型的网络字节顺序到主机字节顺序的转换 (大端->小端)
注,主机字节顺序,X86一般多为小端(little-endian),网络字节顺序,即大端(big-endian);
调用:
cout<<"==========htonl htons ntohl ntohs函数调用=========="<<endl;
printf("16位小端--->大端:%x\n",htons(a));
printf("32位小端--->大端:%x\n",htonl(b));
输出结果:
==========htonl htons ntohl ntohs函数调用==========
16位小端--->大端:3412
32位小端--->大端:78563412