主机字节序和网络字节序

DaemonCoder | 2019-10-24 18:28:19

现代CPU计算时一次都能装载多个字节（如32位计算机一次装载4字节），多字节的数值在内存中高低位的排列方式会影响所表示的数值，以int32类型的数值169756310（十六进制表示为：0x0103070f；二进制表示为：0b 00000001 00000011 00000111 00001111）为例，在内存中用4个字节存储，4个字节的内容分别是0x01（00000001）、0x03（00000011）、0x07（00000111）、0x0f（00001111）。根据字节高低位排序方式的不同，可以分为：大端字节序（big endian）和小端字节序（little endian）。

大端字节序

大端字节序是指一个整数的高位字节（如上例中的0x01）存储在内存的低地址处，可以理解为数值的高位部分靠前存储。以前面的0x0103070f为例，假如存储在内存中的起始地址为0x12345678，则0x0103070f在内存中的存储为：

地址0x12345678处存储内容为：0x01（00000001）

地址0x12345679处存储内容为：0x03（00000011）

地址0x1234567a处存储内容为：0x07（00000111）

地址0x1234567b处存储内容为：0x0f（00001111）

小端字节序

和大端字节序相反，小端字节序把数值的低位字节存储在内存的低地址处，即低位部分靠前存储，0x0103070f在内存中的存储为：

地址0x12345678处存储内容为：0x0f（00001111）

地址0x12345679处存储内容为：0x07（00000111）

地址0x1234567a处存储内容为：0x03（00000011）

地址0x1234567b处存储内容为：0x01（00000001）

主机字节序

现代计算机大多采用小端字节序，所以小端字节序又叫主机字节序。

网络字节序

不同的计算机可能会采用不同的字节序，甚至同一计算机上不同进程会采用不同的字节序，如JAVA虚拟机采用大端字节序，可能和采用小端字节序计算机上的其他进程不同。所以在网络通信（或进程间通信）时，如果都按自己存储的顺序收发数据，有可能会出现一些『误解』。比如采用大端字节序的进程按自己字节序发数据0x0103070f给一个小端字节序进程，发送的内容为：00000001 00000011 00000111 00001111。采用小端字节序的进程接收到数据后，按照小端字节序的定义，00000001是低位字节内容，00001111是高位字节内容，这样就把0x0103070f理解成了0x0f070301。为了避免这个问题，约定数据在不同计算机之间传递时都采用大端字节序，也叫作网络字节序。通信时，发送方需要把数据转换成网络字节序（大端字节序）之后再发送，接收方再把网络字节序转成自己的字节序。上面大端发给小端的例子，大端发送时不需要做处理，直接按自己的字节序发送，小端方接收时把接收到的数据转换成小端字节序后再使用。

Linux字节序转换函数

linux在 netinet/in.h 中定义了以下4个函数：

#include <netinet/in.h>
unsigned long int htonl(unsigned long int hostlong);
unsigned short int htons(unsigned short int hostshort);
unsigned long int ntohl(unsigned long int netlong);
unsigned short int ntohs(unsigned short int netshort);

通过名字大概就可以看出各自的作用。如 htonl 表示 host to network long，即长整型主机字节序转为网络字节序。下面是一个 htonl 的使用示例：

void my_htonl() {
    unsigned long int n1 = 0x0103070f;
    unsigned long int n2 = htonl(n1);
    printf("%08x | %08x", n1, n2);    // 0103070f | 0f070301
}

0x0102070f 经过主机字节序到网络字节序的转换之后就成了 0x0f070301。

微信公共号：

头条号：