📌 汇编语言是很多相关课程(如数据结构、操作系统、微机原理)的重要基础。但仅仅从课程的角度出发就太片面了,其实学习汇编语言可以深入理解计算机底层工作原理,提升代码效率,尤其在嵌入式系统和性能优化方面有重要作用。此外,它在逆向工程和安全领域不可或缺,帮助分析软件运行机制并增强漏洞修复能力。 本专栏的汇编语言学习章节主要是依据王爽老师的《汇编语言》来写的,和书中一样为了使学习的过程容易展开,我们采用以8086CPU为中央处理器的PC机来进行学习。
CPU 内部的寄存器中,有一种特殊的寄存器(对于不同的处理机,个数和结构都可能不同)具有以下3种作用: (1)用来存储相关指令的某些执行结果。 (2)用来为 CPU 执行相关指令提供行为依据。 (3)用来控制 CPU的相关工作方式。
这种特殊的寄存器在8086CPU中,被称为标志寄存器。8086CPU的标志寄存器有16位,其中存储的信息通常被称为程序状态字(PSW)。我们已经使用过8086CPU的ax、bx、cx、dx、si、di、bp、sp、IP、cs、ss、ds、es等13 个寄存器了,本章中的标志寄存器(以下简称为 fag)是我们要学习的最后一个寄存器(✌✌✌太开心了)。
flag 和其他寄存器不一样,其他寄存器是用来存放数据的,都是整个寄存器具有一个含义。而flag寄存器是按位起作用的,也就是说,它的每一位都有专门的含义,记录特定的信息。
8086CPU的flag寄存器的结构,如下图所示。

flag的1、3、5、12、13、14、15位在8086CPU中没有使用,不具有任何含义。而0、2、4、6、7、8、9、10、11位都具有特殊的含义。
在这一章中,我们学习标志寄存器中的CF、PF、ZF、SF、OF、DF 标志位,以及一些与其相关的典型指令。
flag的第6位是ZF,零标志位。
它记录相关指令执行后,
例如:
(1)
mov ax,1
sub ax,1 指令执行后,结果为0,则ZF = 1。
(2)
mov ax,2
sub ax,1 指令执行后,结果为1,则ZF = 0。
对于zf的值,我们可以这样来看,zf标记相关指令的计算结果是否为0。
比如,指令:
(1)
mov ax,1
and ax,0执行后,结果为0,则ZF=1,表示“结果是0”。
(2)
mov ax,1
or ax,0 执行后,结果不为0,则ZF=0,表示“结果非0”。
在8086CPU的指令集中,
有的指令的执行是影响标志寄存器的,比如:add、sub、mul、div、inc、or、and等,它们大都是运算指令(进行逻辑或算术运算);
有的指令的执行对标志寄存器没有影响,比如:mov、push、pop等,它们大都是传送指令。
我们在使用一条指令的时候,要注意这条指令的全部功能,其中包括,执行结果对标记寄存器的哪些标志位造成影响。
flag的第2位是PF,奇偶标志位。
它记录指令执行后,结果的所有二进制位中1的个数:
比如,指令:
(1)
mov al,1
add al,10 执行后,结果为00001011B,其中有3(奇数)个1,则PF=0;
(2)
mov al,1
or al,10执行后,结果为00000011B,其中有2(偶数)个1,则PF=1;
(3)
sub al,al执行后,结果为00000000B,其中有0(偶数)个1,则pf=1。
flag的第7位是SF,符号标志位。
它记录指令执行后,
SF 标志,就是CPU对有符号数运算结果的一种记录 ,它记录数据的正负。
在我们将数据当作有符号数来运算的时候,可以通过它来得知结果的正负。如果我们将数据当作无符号数来运算,SF的值则没有意义,虽然相关的指令影响了它的值。
这也就是说,CPU在执行 add 等指令时,是必然要影响到SF标志位的值的。至于我们需不需要这种影响,那就看我们如何看待指令所进行的运算了。
比如:
(1)
mov al,10000001B
add al,1 执行后,结果为10000010B,SF=1,
表示:如果指令进行的是有符号数运算,那么结果为负;
(2)
mov al,10000001B
add al,01111111B执行后,结果为0,SF=0
表示:如果指令进行的是有符号数运算,那么结果为非负。
我们知道计算机中通常用补码来表示有符号数据。
计算机中的一个数据可以看作是有符号数,也可以看成是无符号数。
比如:
这也就是说,对于同一个二进制数据,计算机可以将它当作无符号数据来运算,也可以当作有符号数据来运算。
比如:
mov al,10000001B
add al,1结果: (al)=10000010B。
不管我们如何看待,CPU 在执行 add 等指令的时候,就已经包含了两种含义,也将得到用同一种信息来记录的两种结果。关键在于我们的程序需要哪一种结果。
某些指令将影响标志寄存器中的多个标记位,这些被影响的标记位比较全面地记录了指令的执行结果,为相关的处理提供了所需的依据。
比如指令sub al,al执行后,ZF、PF、SF等标志位都要受到影响,它们分别为:1、1、0。
flag的第0位是CF,进位标志位。
一般情况下,在进行无符号数运算的时候,它记录了运算结果的最高有效位向更高位的进位值,或从更高位的借位值。
对于位数为N的无符号数来说,其对应的二进制信息的最高位,即第N-1位,就是它的最高有效位,而假想存在的第N位,就是相对于最高有效位的更高位。如下图所示。

我们知道,当两个数据相加的时候,有可能产生从最高有效位向更高位的进位。比如,两个8 位数据:98H+98H,将产生进位。
由于这个进位值在8位数中无法保存,我们在前面的内容中,就只是简单地说这个进位值丢失了。
其实CPU在运算的时候,并不丢弃这个进位值,而是记录在一个特殊的寄存器的某一位上。
8086CPU 就用flag的CF位来记录这个进位值。
比如,下面的指令:
mov al,98H
add al,al ;执行后: (al)=30H,CF=1,CF记录了从最高有效位向更高位的进位值
add al,al ;执行后: (al)=60H,CF=0,另外一种情况,而当两个数据做减法的时候,有可能向更高位借位。
比如,两个 8 位数据:97H-98H,将产生借位,借位后,相当于计算197H-98H。
而flag的CF位也可以用来记录这个借位值。
比如,下面的指令:
mov al,97H
sub al,98H ;执行后:(a1)=FFH,CF=1,CF记录了向更高位的借位值
sub al,al ;执行后:(al)=0,CF=0,CF记录了向更高位的借位值flag的第11位是OF,溢出标志位。
一般情况下,OF记录了有符号数运算的结果是否发生了溢出。
在进行有符号数运算的时候,如结果超过了机器所能表示的范围称为溢出。
由于在进行有符号数运算时,可能发生溢出而造成结果的错误。
则CPU需要对指令执行后是否产生溢出进行记录。
那么,什么是机器所能表示的范围呢?
比如说,指令运算的结果用8位寄存器或内存单元来存放,比如,addal3,那么对于8位的有符号数据,机器所能表示的范围就是-128~127。
同理,对于16位有符号数据,机器所能表示的范围是-32768~32767。
如果运算结果超出了机器所能表达的范围,将产生溢出。
❗注意,这里所讲的溢出,只是对有符号数运算而言。(就像进位只是相对于无符号数而言!)
下面我们看两个溢出的例子。
(1)
mov al,98
add al,99执行后将产生溢出。因为add al,99进行的有符号数运算是:
(al)=(al)+99-98+99=197。
而结果197超出了机器所能表示的8位有符号数的范围:-128~127.
(2)
mov al,0FOH ;FOH,为有符号数-16的补码
add al,088H ;88H,为有符号数-120的补码执行后,将产生溢出。因为add al,088H进行的有符号数运算是:
(al)=(al)+(-120)=(-16)+(-120)=-136
而结果-136超出了机器所能表示的8位有符号数的范围:-128~127。
如果在进行有符号数运算时发生溢出,那么运算的结果将不正确。
就上面的两个例子来说:
(1)
mov al,98
add al,99add 指令运算的结果是(al)=0C5H,因为进行的是有符号数运算,所以al中存储的是有符号数,而C5H是有符号数-59的补码。
如果我们用add指令进行的是有符号数运算,则 98+99=-59这样的结果让人无法接受。
造成这种情况的原因,就是实际的结果197,作为一个有符号数,在8位寄存器al中存放不下。
(2)
同样,对于:
mov al,0FOH ;FOH,为有符号数-16的补码
add al,088H ;88H,为有符号数-120的补码add 指令运算的结果是(al)=78H,因为进行的是有符号数运算,所以al中存储的是有符号数,而78H表示有符号数120。
如果我们用add指令进行的是有符号数运算,则-16-120=120这样的结果显然不正确。
造成这种情况的原因,就是实际的结果-136,作为一个有符号数,在8位寄存器al中存放不下。
一定要注意CF和OF的区别:
比如:
mov al,98
add al,99add 指令执行后:CF=0,OF=1。
前面我们讲过,CPU在执行add等指令的时候,就包含了两种含义:无符号数运算和有符号数运算。
当然,还要用SF位来记录结果的符号。
mov al,0F0H
add al,88Hadd 指令执行后:CF=1,OF=1。
mov al,0F0H
add al,78Hadd 指令执行后:CF=1,OF=0。
🚀🚀🚀我们可以看出,CF和OF所表示的进位和溢出,是分别对无符号数和有符号数运算而言的,它们之间没有任何关系。