深入解析程序运行之预处理

云泽808

发布于 2025-12-30 17:27:55

1390

前言这一篇的内容基本是和上一篇串起来的，建议合在一起看：浅谈程序运行之编译和链接

一、预定义符号

C语言设置了一些预定义符号，可以直接使用，预定义符号也是在预处理期间处理的。

__FILE__  //正在被编译的源文件的名字
__LINE__  //文件当前的行号
__ DATE__ //文件被编译的日期
__TIME__  //文件被编译的时间
__STDC__  //如果编译器遵循ANSI C,其值为1，否则未定义

二、#define 定义常量

基本语法：

#define name stuff

代码演示

这里补充一下什么是寄存器，之前文章写了一些，不过不全，这里做补充：函数栈帧的创建与销毁电脑上有这几种存储器：

内存
硬盘
寄存器 - 集成在CPU上

寄存器的读写速度是非常快的，图中之所以说建议，是因为寄存器的数量有限，最后是由编译器根据当前情况决定要不要把数据放到寄存器中。

在go语言中switch语句里是没有break的，所以如果一个go语言的程序员转到C语言的工作中，可能会不适应，switch语句就出现了下面的一种写法

注意：

续行符\要在每一行的末尾加，指连空格都不可以有
虽然是按照多行写了，但是编译器在处理的时候还是会把这些代码放在一行

特别注意define定义标识符的时候，不要再最后加上;

当宏定义带有分号时，在预处理阶段会进行简单的文本替换：

int a = M; 会被替换为 int a = 100;;（出现了多余的分号）
printf("%d\n", M); 会被替换为 printf("%d\n", 100;);（分号位置错误，导致语法错误）

三、#define定义宏

#define机制包括了一个规定，容许把参数替换到文本中，这种实现通常称为宏（macro）或定义宏（define macro）下面是宏的申明方式：

#define name(parament-list) stuff

其中parament-list是一个由逗号隔开的符号表，它们可能出现在stuff中

注意：参数列表的左括号必须与name紧邻，如果两者之间有任何空白存在，参数列表就会被解释为stuff的一部分

演示代码

乍一看这个代码看似没什么问题，但其实存在一个潜在问题

按照一般的思考这段代码打印36，实际上是11，注释部分就是原因，预处理替换产生的表达式并没有按照预想的次序进行求值

在宏定义上加上两个括号，这个问题就解决了

然而这种方法也会带来新的问题

按照一般逻辑，打印的值应该是100，然而实际是55 这是因为乘法运算是先于宏定义的加法的，就需要再加一对括号了

提示：所以用于对数值表达式进行求值的宏定义都应该用这种方式加上括号，避免在使用宏时由于参数中的操作符和临近操作符之间补课预料的相互作用。

四、带有副作用的宏参数

当宏参数在宏的定义中出现超过一次的时候，如果参数带有副作用，那么在使用这个宏的时候可能就会出现不可预测的结果。副作用就是表达式求值的时候出现的永久性效果：

x+1;//不带有副作用
x++；//带有副作用

MAX宏可以证明具有副作用的的参数所引起的问题：

五、宏替换的规则

在程序中扩展#define定义符号和宏时，需要涉及几个步骤

在调用宏时，首先对参数进行检查，看看是否包含任何由#define定义的符号。如果是，它们首先被替换

替换文本随后被插入到程序中原来文本的位置。对于宏，参数名被他们的值所替换
最后，再次对结果文件进行扫描，看看它是否包含任何由#define定义的符号。如果是，就重复上述处理过程。

注意：

宏参数和#define定义中可能出现其他#define定义的符号。但是对于宏，不能出现递归
当预处理器搜索#define定义的符号的时候，字符串常量的内容并不被搜索

六、宏函数的对比

宏通常被应用于执行简单的运算。比如前面在两个数种找出较大的一个时，写成宏更有优势：

原因有二：

用于调用函数和从函数返回的代码可能比实际执行这个小型计算工作所需要的时间更多（函数涉及调用函数，执行计算，函数返回，其中又有函数栈帧的创建与销毁，之中需要执行多条汇编指令）。所以宏函数在程序的规模和速度方面更胜一筹 深入解析函数栈帧的创建与销毁 - 理解反汇编代码与程序运行的最底层原理
更为重要的是函数的参数必须声明为特定的类型。所以函数只能在类型合适的表达式上使用。反之宏的参数可以适用于整型、长整型、浮点型等可以用>来比较的类型。宏的参数是类型无关的

和函数相比宏的缺点：

每次使用宏的时候，一份宏定义的代码将插入到程序中。除非宏比较短，否则可能大幅度增加程序的长度。
宏是没法调试的，实际调试时看到的代码和预处理的代码是不一样的
宏由于类型无关，也就不够严谨
宏可能会带来运算符优先级的问题，导致程序容易出错

宏有时候可以做函数做不到的事情。比如：宏的参数可以出现类型，但是函数做不到

宏和函数的一个对比

七、#和##

7.1 #运算符

#运算符将宏的一个参数转换为字符串字面量。它仅允许出现在带参数的宏的替换列表中 #运算符所执行的操作可以理解为“字符串化” 还要补充一个内容：

可以看出多个字符串拼接打印会合并为一个字符串

代码演示

按照前面的理解，可以看到这样定义的宏打印结果还是有些问题的，a和f并没有替换到宏内，这时候就要用#

稍作改进，加上#后，并用多个字符串拼接起来

这里PRINT（a）；把a替换到宏的体内时，就使用#a，#a就是“a”

7.2 ##运算符

##可以把位于它两边的符号合成一个符号，它允许宏定义从分离的文本片段创建标识符。##被称为记号粘合这样的链接必须产生一个合法的标识符。否则其结果就是未定义的

代码演示，这里利用宏做一个比较函数大小的模板

这样就是用宏定义了不同函数，这样的例子在实际开发中使用的比较少。

八、命名约定

因为宏和函数的使用语法很相似，所以程序员中有一个习惯用来区分二者

把宏名全部大写
函数名不要全部大写

九、#undef

这条指令用于移除一个宏定义

#undef NAME
//如果现存的一个名字需要被重新定义，那么它的旧名字首先要被移除

十、命令行定义

许多C的编译器提供一种能力，允许在命令行中定义符号。用于启动编译过程

我这里用vscode远程连了一台linux机器，linux机器有一些指令

ls是一个工具命令，工具想要产生不同的效果要设置参数，-a，-l，-al叫命令的参数

这里数组没有赋值，所以报错

这里在编译时指定SZ的值给其赋值，就可以正常打印。命令行定义就是执行程序在参数部分定义一些值。

//linux 环境演示
gcc -D ARRAY_SIZE=10 programe.c

其适用情景就是当我们根据同一个源文件要编译出一个程序的不同版本的时候，这个特性有点用处。（假设某个程序中声明了一个某个长度的数组，如果机器内存有限，我们需要一个很小的数组，但是另一个机器内存大些，我们需要一个数组能够大些）

十一、条件编译

在编译一个程序的时候，有时候需要将一条语句（一组语句）编译或者放弃这里使用条件编译指令是很方便的比如说：调试性的代码，删除可惜，保留又碍事，所以可以选择性的编译

#ifdef和#endif是一对，第一个的意思是如果定义了__DEBUG__，后面的printf语句参与编译，反之预处理过程种printf这句代码不参与编译，#endif是用来结束的

常见的条件编译指令

1.
#if 常量表达式，为真下一句代码参与编译，反之
      //...
#endif  //用来结束if的

2.多个分支的条件编
//特点就是前面有一个表达式为真，后面不进行判断
#if 常量表达式
     //...
#elif 常量表达式
     //...
#else
     //...
#endif //结束

3.判断是否被定义
#if defined(symbol) //定义则表达式进行编译
//等价于
#ifdef symbol

#if !defined(symbol)  //没有定义则表达式进行编译
//等价于
#ifndef symbol

补充：

十二、头文件的包含

12.1 头文件被包含的方式

12.1.1 本地文件包含

#include "filename"

查找策略：先在源文件所在目录下查找，如果该头文件未找到，编译器就像查找库函数头文件一样在标准位置查找头文件。如果找不到就提示编译错误 Linux环境的标准头文件的路径：

/usr/include

VS环境的标准头文件的路径：这里转到定义

右键打开文件夹

12.1.2 库文件包含

#include <filename.h>

查找头文件直接去标准路径下去查找，如果找不到就提示编译错误也就是说，对于库文件也可以使用“ ”的形式包含，但是这样查找的效率低一些，也不好区分是库文件还是本地文件

12.2 嵌套文件包含

#include指令可以使另外一个文件被编译这种预处理中的替换方式很简单：预处理器先删除这条指令，并用包含文件的内容替换。也就是说一个头文件被包含10次，那就实际上被编译10次，如果重复包含，对编译的压力就比较大

左边的代码是test.c中的代码，右边是test.h中的代码如果直接这样写，test.c文件中将test.h包含5次，那么test.h文件的内容将被拷贝5份在test.c中。在企业级开发中，test.h文件通常都比较大，这样预处理后代码量会剧增。要解决这样头文件被重复引入的问题就是用条件编译 每个头文件的开头写：

#ifndef __TEST_H__ //符号是可以自己定义的
#define __TEST_H__
//头文件的内容
#endif  //__TEST_H__

这串代码也很好理解

#ifndef __TEST_H__

如果没有定义__TEST_H__

#define __TEST_H__

则定义__TEST_H__，后面函数声明参与编译

第二次包含头文件时，因为定义了__TEST_H__，#ifndef __TEST_H__为假，函数声明不参与编译，删除函数声明这串代码，后续的头文件结果也都一样

这是一种较古老的条件编译写法，还有一种现代的写法

//在test.h文件中第一行加这串代码
#pragma once

就可以避免头文件的重复引入。

总结

这篇就是C语言专栏的最后一篇内容了，耗时4个月，1w多行代码，将C语言的内容仔细剖析，市面上有的和没有的内容全写完了，接下来开始数据结构专栏~

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。

原始发表：2025-07-26，如有侵权请联系 cloudcommunity@tencent.com 删除

编译器

本文分享自作者个人站点/博客前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度