内存内容操作函数详解[1]：memcmp()

byte轻骑兵

发布于 2026-01-20 16:43:28

3030

作者简介：byte轻骑兵，现就职于国内知名科技企业，专注于嵌入式系统研发。深耕 Android、Linux、RTOS、通信协议、AIoT、物联网及 C/C++ 等领域，乐于技术交流与分享。欢迎技术交流。 主页地址：byte轻骑兵-CSDN博客 微信公众号：「嵌入式硬核研究所」 邮箱：byteqqb@163.com 声明：本文为「byte轻骑兵」原创文章，未经授权禁止任何形式转载。商业合作请联系作者授权。

在 C 语言的内存操作函数家族中，memcmp () 是用于比较内存块的核心函数。它不像 strcmp () 那样只关注字符串，而是能对任意类型的内存数据进行逐字节比对，在系统编程、数据校验、协议解析等场景中发挥着不可替代的作用。

一、函数简介

memcmp () 函数的核心功能是按字节比较两个内存块的前 n 个字节，并返回比较结果。与字符串比较函数 strcmp () 相比，它具有三个显著特点：

不依赖终止符：strcmp () 遇到 '\0' 会停止比较，而 memcmp () 严格按照指定的 n 字节长度进行比较，即使内存中包含 '\0' 也不会提前终止
适用任意数据：可用于比较字符、整数、结构体、二进制数据等各种类型，不受数据内容限制
逐字节比对：按照内存中实际存储的字节序列进行比较，而非数据的逻辑值（如整数的大小）

这种底层特性使 memcmp () 成为内存数据校验、二进制协议解析、数据块一致性检查等场景的理想工具。例如在网络编程中，可用于验证数据包头部的魔术字；在文件操作中，可用于比较两个文件块是否相同。

二、函数原型

memcmp () 函数定义在 < string.h> 头文件中，其标准原型如下：

int memcmp(const void *s1, const void *s2, size_t n);

参数解析：
- s1：指向第一个内存块的指针，const 修饰表示函数不会修改该内存块的内容
- s2：指向第二个内存块的指针，同样受 const 保护
- n：要比较的字节数，类型为 size_t（无符号整数）
返回值规则：
- 若 s1 指向的内存块大于 s2 指向的内存块，返回正整数（通常为 1，但标准未规定具体值）
- 若两个内存块相等，返回0
- 若 s1 指向的内存块小于 s2 指向的内存块，返回负整数（通常为 - 1）

返回值的正负由两个内存块中第一个不同字节的差值决定（s1 字节 - s2 字节），例如当 s1 的第 3 个字节为 0x35，s2 的第 3 个字节为 0x33 时，返回值为 2。

三、函数实现（伪代码）

虽然不同编译器和标准库对memcmp()的具体实现可能有所不同，但基本思路是一致的。以下是一个简化的伪代码实现，帮助我们理解memcmp()的工作原理：

int memcmp(const void *s1, const void *s2, size_t n) {
    // 将void指针转换为unsigned char指针，确保按无符号字节处理
    const unsigned char *p1 = (const unsigned char *)s1;
    const unsigned char *p2 = (const unsigned char *)s2;
    
    // 循环比较每个字节
    while (n-- > 0) {
        if (*p1 != *p2) {
            // 返回第一个不同字节的差值
            return *p1 - *p2;
        }
        p1++;
        p2++;
    }
    
    // 所有字节都相同
    return 0;
}

实现要点解析：

使用 unsigned char：避免符号位干扰比较结果。例如对于 0xFF（-1 的补码）和 0x7F（127），无符号比较能正确反映内存实际值
短路比较：一旦发现不同字节立即返回，无需比较后续内容，提升效率
原始字节差值：返回值是实际字节差值而非固定的 ±1，这与 strcmp () 的行为一致
n=0 的处理：当 n 为 0 时直接返回 0，符合 C 标准规范

在实际实现中，为了提高性能，库开发者通常会使用更高效的方法：

字长比较：如果硬件平台支持，会使用更大的数据宽度（如4字节或8字节）进行比较，减少循环次数
对齐处理：检查内存地址是否对齐，对齐的内存访问通常更快
硬件指令：某些平台可能有专门的内存比较指令，库函数会利用这些指令
向量化：使用SIMD指令集（如SSE、AVX）一次比较多个字节

由于这些优化措施的实现细节高度依赖于具体的硬件和编译器，因此很难在这里给出一个确切的、适用于所有情况的 memcmp 实现源码。

如果对某个特定编译器或库（如 glibc、musl libc、MSVC 等）的 memcmp 实现感兴趣，可以直接查看其源代码。这些源代码通常可以在各自的代码仓库中找到，并且包含了丰富的注释和文档，以帮助理解其工作原理和优化策略。

实际开发中，为了提高效率，在大多数情况下，直接使用标准库中的 memcmp 函数就足够了。

四、使用场景

memcmp () 的底层特性使其在多种场景中具有不可替代性，以下是典型应用场景及实例：

1. 二进制数据比较

在处理图像、音频、视频等二进制文件时，需验证数据块的一致性。例如比较两个 BMP 图像的文件头：

#include <stdio.h>
#include <string.h>

// BMP文件头结构（简化版）
typedef struct {
    unsigned short bfType;    // 文件类型，应为0x4D42
    unsigned int bfSize;      // 文件大小
    unsigned short bfReserved1;
    unsigned short bfReserved2;
    unsigned int bfOffBits;   // 像素数据偏移量
} BMPHeader;

int main() {
    FILE *f1 = fopen("image1.bmp", "rb");
    FILE *f2 = fopen("image2.bmp", "rb");
    
    BMPHeader h1, h2;
    fread(&h1, sizeof(h1), 1, f1);
    fread(&h2, sizeof(h2), 1, f2);
    
    // 比较两个BMP文件头
    if (memcmp(&h1, &h2, sizeof(BMPHeader)) == 0) {
        printf("文件头结构相同\n");
    } else {
        printf("文件头结构不同\n");
    }
    
    fclose(f1);
    fclose(f2);
    return 0;
}

2. 结构体数据校验

在网络通信中，可使用 memcmp () 验证接收的结构体数据是否与发送的一致（适用于不含指针的结构体）：

#include <stdio.h>
#include <string.h>

// 定义网络数据包结构
typedef struct {
    unsigned int pkgId;
    unsigned char type;
    unsigned short crc;
    char data[64];
} NetPackage;

// 模拟发送数据包
void sendPackage(NetPackage *pkg) {
    // 实际场景中通过网络发送
}

// 模拟接收数据包
void recvPackage(NetPackage *pkg) {
    // 实际场景中从网络接收
}

int main() {
    NetPackage sendPkg = {1001, 0x02, 0x1A3B, "test data"};
    NetPackage recvPkg;
    
    sendPackage(&sendPkg);
    recvPackage(&recvPkg);
    
    // 校验接收的数据是否与发送的一致
    if (memcmp(&sendPkg, &recvPkg, sizeof(NetPackage)) == 0) {
        printf("数据传输完整\n");
    } else {
        printf("数据传输异常\n");
    }
    
    return 0;
}

3. 数组部分元素比较

比较数组中指定范围的元素，例如比较两个整数数组的前 5 个元素：

#include <stdio.h>
#include <string.h>

int main() {
    int arr1[] = {1, 3, 5, 7, 9, 11};
    int arr2[] = {1, 3, 5, 8, 9, 13};
    
    // 比较前4个元素（每个int占4字节，4个元素共16字节）
    int result = memcmp(arr1, arr2, 4 * sizeof(int));
    
    if (result == 0) {
        printf("前4个元素相同\n");
    } else if (result > 0) {
        printf("arr1前4个元素大于arr2\n");
    } else {
        printf("arr1前4个元素小于arr2\n");
    }
    // 输出：arr1前4个元素小于arr2（因第4个元素7 < 8）
    return 0;
}

4. 密码哈希值比对

在验证用户密码时，可比较存储的哈希值与输入密码的哈希值是否一致：

#include <stdio.h>
#include <string.h>

// 模拟哈希计算函数
void calculateHash(const char *input, unsigned char *hash) {
    // 实际场景中使用SHA-256等算法
    for (int i = 0; i < 16; i++) {
        hash[i] = input[i] ^ 0xAA;  // 简化的哈希计算
    }
}

int main() {
    char userInput[] = "correct_password";
    unsigned char storedHash[16] = {0x55, 0x33, 0x77, 0x11, 
                                   0x22, 0x44, 0x66, 0x88,
                                   0x99, 0xBB, 0xDD, 0xFF,
                                   0xEE, 0xCC, 0xAA, 0x99};
    unsigned char inputHash[16];
    
    calculateHash(userInput, inputHash);
    
    // 比较哈希值
    if (memcmp(storedHash, inputHash, 16) == 0) {
        printf("密码验证通过\n");
    } else {
        printf("密码错误\n");
    }
    
    return 0;
}

五、注意事项

memcmp () 虽然使用简单，但在实际应用中若不注意细节，可能导致难以排查的错误。以下是必须掌握的注意事项：

1. 数据类型与字节序影响

memcmp () 比较的是内存中的原始字节，而非数据的逻辑值。对于多字节类型（如 int、float），其比较结果可能受字节序（大小端）影响：

#include <stdio.h>
#include <string.h>

int main() {
    int a = 0x00000001;  // 小端存储：01 00 00 00
    int b = 0x01000000;  // 小端存储：00 00 00 01
    
    // 比较结果为第一个字节的差值：0x01 - 0x00 = 1
    if (memcmp(&a, &b, sizeof(int)) > 0) {
        printf("a的内存大于b\n");  // 会执行此分支
    } else {
        printf("a的内存小于等于b\n");
    }
    
    // 但逻辑上a=1 < b=16777216
    return 0;
}

结论：不要用 memcmp () 比较多字节数值的逻辑大小，应直接使用关系运算符（>、< 等）。

2. 结构体中的填充字节问题

C 语言结构体可能包含编译器添加的填充字节（用于对齐），这些字节的值不确定，会导致 memcmp () 比较结果不可靠：

#include <stdio.h>
#include <string.h>

// 包含填充字节的结构体（假设int占4字节，char占1字节）
struct Test {
    char c;  // 1字节
    int i;   // 4字节，前面会有3字节填充
};

int main() {
    struct Test t1 = {'a', 100};
    struct Test t2 = {'a', 100};
    
    // 填充字节的值可能不同，导致比较结果非0
    if (memcmp(&t1, &t2, sizeof(struct Test)) == 0) {
        printf("结构体相等\n");
    } else {
        printf("结构体不等（填充字节影响）\n");  // 可能执行此分支
    }
    
    return 0;
}

解决方案：比较结构体时应逐个成员比较，而非直接使用 memcmp ()。

3. 指针有效性与越界

s1 和 s2 必须指向有效的内存区域，且比较的 n 字节不能超出其指向的内存范围，否则会导致未定义行为（如程序崩溃、数据泄露）：

#include <stdio.h>
#include <string.h>

int main() {
    char buf[5] = "abcde";
    char *p = "fghij";  // 字符串常量，通常在只读内存区
    
    // 错误：比较6字节超出buf的5字节空间
    memcmp(buf, p, 6);  // 未定义行为，可能崩溃
    
    return 0;
}

最佳实践：使用 memcmp () 前务必验证：

s1 和 s2 不为 NULL
n 不超过两个内存块的实际大小

4. 浮点型比较的陷阱

浮点数在内存中的存储格式（如 IEEE 754）导致 memcmp () 无法正确比较其逻辑相等性：

#include <stdio.h>
#include <string.h>

int main() {
    float f1 = 1.0f;
    float f2 = 1.0000001f;
    
    // 内存中字节不同，比较结果非0
    if (memcmp(&f1, &f2, sizeof(float)) == 0) {
        printf("内存相同\n");
    } else {
        printf("内存不同\n");  // 执行此分支
    }
    
    // 但实际应用中可能认为它们相等（差值小于阈值）
    if (fabs(f1 - f2) < 1e-6) {
        printf("逻辑上近似相等\n");  // 执行此分支
    }
    
    return 0;
}

结论：浮点数比较应使用差值与阈值比较法，而非 memcmp ()。

5. n=0 的特殊处理

当 n=0 时，memcmp () 标准规定返回 0，且不访问任何内存。这一特性可用于简化边界条件处理：

// 安全的比较函数，n可为0
int safeCompare(const void *s1, const void *s2, size_t n) {
    if (s1 == NULL || s2 == NULL) return -1;  // 自定义错误处理
    return memcmp(s1, s2, n);  // n=0时返回0，无需额外判断
}

六、示例代码进阶

以下示例展示 memcmp () 在复杂场景中的应用，涵盖错误处理、性能优化等高级技巧。

1. 内存块分块比较（大文件校验）

对于超大内存块（如 GB 级文件），一次性比较可能占用过多资源，可分块比较并及时反馈进度：

#include <stdio.h>
#include <string.h>
#include <stdlib.h>

// 分块比较两个文件的内容
int compareFiles(const char *path1, const char *path2, size_t blockSize) {
    FILE *f1 = fopen(path1, "rb");
    FILE *f2 = fopen(path2, "rb");
    if (!f1 || !f2) return -1;
    
    unsigned char *buf1 = malloc(blockSize);
    unsigned char *buf2 = malloc(blockSize);
    if (!buf1 || !buf2) {
        fclose(f1);
        fclose(f2);
        return -1;
    }
    
    size_t bytesRead1, bytesRead2;
    size_t totalRead = 0;
    
    while (1) {
        bytesRead1 = fread(buf1, 1, blockSize, f1);
        bytesRead2 = fread(buf2, 1, blockSize, f2);
        
        // 读取字节数不同，文件必然不同
        if (bytesRead1 != bytesRead2) {
            free(buf1);
            free(buf2);
            fclose(f1);
            fclose(f2);
            return 1;
        }
        
        // 到达文件末尾
        if (bytesRead1 == 0) break;
        
        // 分块比较
        int result = memcmp(buf1, buf2, bytesRead1);
        if (result != 0) {
            free(buf1);
            free(buf2);
            fclose(f1);
            fclose(f2);
            return result;
        }
        
        totalRead += bytesRead1;
        printf("已比较 %zu 字节\n", totalRead);  // 进度反馈
    }
    
    free(buf1);
    free(buf2);
    fclose(f1);
    fclose(f2);
    return 0;
}

int main() {
    int result = compareFiles("file1.dat", "file2.dat", 4096);
    if (result == 0) {
        printf("两个文件内容相同\n");
    } else if (result > 0) {
        printf("file1大于file2\n");
    } else {
        printf("file1小于file2或比较出错\n");
    }
    return 0;
}

2. 自定义数据结构比较

结合函数指针，使用 memcmp () 实现自定义数据结构的比较器，用于排序或查找：

#include <stdio.h>
#include <string.h>
#include <stdlib.h>

// 自定义数据结构
typedef struct {
    char key[16];
    int value;
} KeyValue;

// 比较函数：先比较key（用memcmp），再比较value
int compareKV(const void *a, const void *b) {
    const KeyValue *kv1 = (const KeyValue *)a;
    const KeyValue *kv2 = (const KeyValue *)b;
    
    // 比较key的前16字节
    int cmp = memcmp(kv1->key, kv2->key, 16);
    if (cmp != 0) return cmp;
    
    // key相同则比较value
    return kv1->value - kv2->value;
}

int main() {
    KeyValue arr[] = {
        {"apple", 5},
        {"banana", 3},
        {"apple", 7}
    };
    int n = sizeof(arr) / sizeof(arr[0]);
    
    // 使用qsort排序，传入自定义比较器
    qsort(arr, n, sizeof(KeyValue), compareKV);
    
    // 排序结果：apple(5)、apple(7)、banana(3)
    for (int i = 0; i < n; i++) {
        printf("%s: %d\n", arr[i].key, arr[i].value);
    }
    
    return 0;
}