DaemonCoder
主机字节序和网络字节序
DaemonCoder | 2019-10-24 18:28:19

现代CPU计算时一次都能装载多个字节(如32位计算机一次装载4字节),多字节的数值在内存中高低位的排列方式会影响所表示的数值,以int32类型的数值169756310(十六进制表示为:0x0103070f;二进制表示为:0b 00000001 00000011 00000111 00001111)为例,在内存中用4个字节存储,4个字节的内容分别是0x01(00000001)、0x03(00000011)、0x07(00000111)、0x0f(00001111)。根据字节高低位排序方式的不同,可以分为:大端字节序(big endian)和 小端字节序(little endian)。

大端字节序

大端字节序是指一个整数的高位字节(如上例中的0x01)存储在内存的低地址处,可以理解为数值的高位部分靠前存储。以前面的0x0103070f为例,假如存储在内存中的起始地址为0x12345678,则0x0103070f在内存中的存储为:
地址0x12345678处存储内容为:0x01(00000001)
地址0x12345679处存储内容为:0x03(00000011)
地址0x1234567a处存储内容为:0x07(00000111)
地址0x1234567b处存储内容为:0x0f(00001111)

小端字节序

和大端字节序相反,小端字节序把数值的低位字节存储在内存的低地址处,即低位部分靠前存储,0x0103070f在内存中的存储为:
地址0x12345678处存储内容为:0x0f(00001111)
地址0x12345679处存储内容为:0x07(00000111)
地址0x1234567a处存储内容为:0x03(00000011)
地址0x1234567b处存储内容为:0x01(00000001)

主机字节序

现代计算机大多采用小端字节序,所以小端字节序又叫主机字节序。

网络字节序

不同的计算机可能会采用不同的字节序,甚至同一计算机上不同进程会采用不同的字节序,如JAVA虚拟机采用大端字节序,可能和采用小端字节序计算机上的其他进程不同。所以在网络通信(或进程间通信)时,如果都按自己存储的顺序收发数据,有可能会出现一些『误解』。比如采用大端字节序的进程按自己字节序发数据0x0103070f给一个小端字节序进程,发送的内容为:00000001 00000011 00000111 00001111。采用小端字节序的进程接收到数据后,按照小端字节序的定义,00000001是低位字节内容,00001111是高位字节内容,这样就把0x0103070f理解成了0x0f070301。为了避免这个问题,约定数据在不同计算机之间传递时都采用大端字节序,也叫作网络字节序。通信时,发送方需要把数据转换成网络字节序(大端字节序)之后再发送,接收方再把网络字节序转成自己的字节序。上面大端发给小端的例子,大端发送时不需要做处理,直接按自己的字节序发送,小端方接收时把接收到的数据转换成小端字节序后再使用。

Linux字节序转换函数

linux在 netinet/in.h 中定义了以下4个函数:
#include <netinet/in.h>
unsigned long int htonl(unsigned long int hostlong);
unsigned short int htons(unsigned short int hostshort);
unsigned long int ntohl(unsigned long int netlong);
unsigned short int ntohs(unsigned short int netshort);
通过名字大概就可以看出各自的作用。如 htonl 表示 host to network long,即长整型主机字节序转为网络字节序。下面是一个 htonl 的使用示例:
void my_htonl() {
    unsigned long int n1 = 0x0103070f;
    unsigned long int n2 = htonl(n1);
    printf("%08x | %08x", n1, n2);    // 0103070f | 0f070301
}
0x0102070f 经过主机字节序到网络字节序的转换之后就成了 0x0f070301。


微信公共号:

头条号: