前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【汇编】(八)更灵活的定位内存地址的方法

【汇编】(八)更灵活的定位内存地址的方法

作者头像
sidiot
发布2023-08-31 13:14:35
2790
发布2023-08-31 13:14:35
举报
文章被收录于专栏:技术大杂烩

前言

前面,我们用 [0]、[bx] 的方法,在访问内存的指令中,定位内存单元的地址。在这一篇博文中,我们主要讲解一些更灵活的定位内存地址的方法和相关的编程方法。  

and 和 or 指令

and 指令:逻辑与指令,按位进行与运算

例如指令:

代码语言:javascript
复制
mov al, 01100011B 
and al, 00111011B

执行后:al = 00100011B

通过该指令可将操作对象的相应位设为0,其他位不变。

例如:

  • 将 al 的第6位设为0:and al, 10111111B
  • 将 al 的第7位设为0:and al, 01111111B
  • 将 al 的第0位设为0:and al, 11111110B;  

or 指令:逻辑或指令,按位进行或运算

例如指令:

代码语言:javascript
复制
mov al, 01100011B 
or al, 00111011B

执行后:al = 01111011B

通过该指令可将操作对象的相应位设为1,其他位不变。

例如:

  • 将 al 的第6位设为1:and al, 01000000B
  • 将 al 的第7位设为1:and al, 10000000B
  • 将 al 的第0位设为1:and al, 00000001B;  

关于 ASCII 码

世界上有很多编码方案,有种方案叫做 ASCII 编码,是在计算机系统中通常被采用的。

简单地说,所谓编码方案,就是一套规则,它约定了用什么样的信息来表示现实对象。

比如说,在 ASCII 编码方案中,用 61H 表示 “a”,62H 表示 “b”。

一种规则需要人们遵守才有意义。

一个文本编辑过程中,就包含着按照 ASCII 编码规则进行的编码和解码。

在文本编辑过程中,我们按一下键盘的 a 键,就会在屏幕上看到 “a”,但这是怎样一个过程呢?

就是给显卡提供 “a” 的 ASCII 码,61H,也就是写入显存中;  

以字符形式给出的数据

我们可以在汇编程序中,用 '…' 的方式指明数据是以字符的形式给出的,编译器将把它们转化为相对应的 ASCII 码,如下:

代码语言:javascript
复制
assume ds:data
data segment
 db 'unIX' 
 db 'foRK'
data ends
code segment
  start:mov al,'a'
        mov bl,'b'
        mov ax,4c00h
        int 21h
code ends
end start  

上面的源程序中:

  • db 'unIX' 相当于 db 75H,6EH,49H,58HunIX 的 ASCII 码分别为75H、6EH、49H、58H;
  • db 'foRK' 相当于 db 66H,6FH,52H,4BHfoRK 的ASCII码分别为66H、6FH、52H、4BH;
  • mov al,'a' 相当于 mov al,61Ha 的 ASCII 码为61H;
  • mov al,'b' 相当于 mov al,62Hb 的 ASCII 码为62H;  

大小写转换的问题

首先分析一下,我们知道同一个字母的大写字符和小写字符对应的 ASCII 码是不同的,比如 “A” 的 ASCII 码是41H,“a” 的 ASCII 码是61H。

要改变一个字母的大小写,实际上就是要改变它所对应的 ASCII 码。

我们可以将所有的字母的大写字符和小写字符所对应的 ASCII 码列出来,进行对比,从中找到规律。

代码语言:javascript
复制
大写        二进制           小写        二进制
 A         01000001          a         01100001
 B         01000010          b         01100010
 C         01000011          c         01100011
 D         01000100          d         01100100

通过对比,我们可以看出来,小写字母的 ASCII 码值比大写字母的 ASCII 码值大20H 。

这样,我们可以想到,如果将 “a” 的 ASCII 码值减去20H,就可以得到 “A”;如果将 “A” 的 ASCII 码值加上20H就可以得到 “a”。

由于此前并没有学习判断指令,因此只能换一种方式,观察,就 ASCII 码的二进制形式来看,除第5位(位数从0开始计算)外,大写字母和小写字母的其他各位都一样。

大写字母 ASCII 码的第5位(位数从0开始计算)为0,小写字母的第5位为1;因此只要把握这个规律就可以进行大小写转换了,这里使用 and 或者 or 指令来实现操作;  

[bx+idata]

在前面,我们可以用 [bx] 的方式来指明一个内存单元, 我们还可以用一种更为灵活的方式来指明内存单元:

[bx+idata] 表示一个内存单元,它的偏移地址为 (bx)+idata(bx 中的数值加上 idata)。

我们看一下指令 mov ax,[bx+200] 的含义:

  • 将一个内存单元的内容送入 ax,这个内存单元的长度为2字节(字单元),存放一个字,偏移地址为 bx 中的数值加上200,段地址在 ds 中。
  • (ax) = ((ds)*16+(bx)+200)

指令 mov ax,[bx+200] 也可以写成如下格式(常用):

  • mov ax,[200+bx]
  • mov ax,200[bx]
  • mov ax,[bx].200

问题

用 Debug 查看内存,结果如下: 2000:1000 BE 00 06 00 00 00 … 写出下面的程序执行后,ax、bx、cx 中的内容。

代码语言:javascript
复制
 mov ax,2000H
 mov ds,ax
 mov bx,1000H
 mov ax,[bx]
 mov cx,[bx+1]
 add cx,[bx+2]
  • mov ax,[bx] 是访问的字单元的段地址在 ds 中,即 (ds)=2000H;偏移地址在 bx 中,(bx)=1000H;指令执行后 (ax)=00BEH
  • mov cx,[bx+1] 访问的字单元的段地址在 ds 中,(ds)=2000H;偏移地址 (bx)+1=1001H;指令执行后 (cx)=0600H
  • add cx,[bx+2] 访问的字单元的段地址在 ds 中,(ds)=2000H;偏移地址 (bx)+2=1002H;指令执行后 (cx)=0606H

有了 [bx+idata] 这种表示内存单元的方式,我们就可以用更高级的结构来看待所要处理的数据。

用 [bx+idata] 的方式进行数组的处理

在 codesg 中填写代码,将 datasg 中定义的第一个字符串,转化为大写,第二个字符串转化为小写。

代码语言:javascript
复制
assume cs:codesg,ds:datasg
datasg segment
db 'BaSiC'
db 'MinIX'
datasg ends

codesg segment
 start: …
codesg ends
end start

按照原来的方法,用 [bx] 的方式定位字符串中的字符。

代码语言:javascript
复制
       mov ax,datasg
       mov ds,ax	
       mov bx,0	
       mov cx,5			
    s: mov al,[bx]		
       and al,11011111b		
       mov [bx],al	
       inc bx			
       loop s
       mov bx,5
       mov cx,5		
   s0: mov al,[bx]
       or al,00100000b		
       mov [bx],al
       inc bx
       loop s0

现在,我们有了 [bx+idata] 的方式,就可以用更简化的方法来完成上面的程序。

我们观察 datasg 段中的两个字符串,一个的起始地址为0,另一个的起始地址为5。

我们可以将这两个字符串看作两个数组,一个从0地址开始存放,另一个从5开始存放。

那么我们可以用 [0+bx] 和 [5+bx] 的方式在同一个循环中定位这两个字符串中的字符。

在这里,0和5给定了两个字符串的起始偏移地址,bx 中给出了从起始偏移地址开始的相对地址。

这两个字符串在内存中的起始地址是不一样的,但是,它们中的每一个字符,从起始地址开始的相对地址的变化是相同的。

改进后的程序:

代码语言:javascript
复制
     mov ax,datasg
	mov ds,ax
	mov bx,0

	mov cx,5
s:	mov al,[bx]			;定位第一个字符串的字符
	and al,11011111b
	mov [bx],al
	mov al,[5+bx]		;定位第二个字符串的字符
	or al,00100000b
	mov [5+bx],al
	inc bx
	loop s

SI 和 DI

SI 和 DI 是 8086CPU 中和 bx 功能相近的寄存器,但是 SI 和 DI 不能够分成两个8 位寄存器来使用。

下面的三组指令实现了相同的功能:

(1)

代码语言:javascript
复制
mov bx,0
mov ax,[bx]

(2)

代码语言:javascript
复制
mov si,0
mov ax,[si]

(3)

代码语言:javascript
复制
mov di,0
mov ax,[di]

用寄存器 SI 和 DI 实现将字符串 ‘welcome to masm!’ 复制到它后面的数据区中;

代码语言:javascript
复制
assume cs:codesg,ds:datasg
datasg segment 
  db 'welcome to masm!'
  db '................'
datasg ends

分析:

我们编写的程序大都是进行数据的处理,而数据在内存中存放,所以我们在处理数据之前首先要搞清楚数据存储在什么地方,也就是说数据的内存地址。

因为 “welcome to masm!” 从偏移地址0开始存放,长度为 16 个字节,所以,它后面的数据区的偏移地址为 16 ,就是字符串所要存放的空间。

ds:si 指向要复制的源始字符串,用 ds:di 指向复制的目的空间,然后用一个循环来完成复制。

代码语言:javascript
复制
codesg segment
start: mov ax,datasg
         mov ds,ax
         mov si,0
         mov di,16
         mov cx,8
    s:  mov ax,[si]
         mov [di],ax
         add si,2
         add di,2
         loop s

         mov ax,4c00h
         int 21h
codesg ends
end start

注意:在程序中,用16位寄存器进行内存单元之间的数据传送,一次复制 2 个字节,一共循环8次。

当然,也可以使用 [bx(si/di)+idata] 来使得程序更加简洁:

代码语言:javascript
复制
codesg segment
start: mov ax,datasg
         mov ds,ax
         mov si,0
         mov cx,8
    s:  mov ax,0[si]
         mov 16[si],ax
         add si,2
         loop s
         mov ax,4c00h
         int 21h
codesg ends
end start

[bx+si] 和 [bx+di]

[bx+si] 表示一个内存单元,它的偏移地址为(bx)+(si)(即 bx 中的数值加上 si 中的数值);

指令 mov ax,[bx+si] 的数学化的描述为:(ax)=( (ds)*16+(bx)+(si) );

该指令也可以写成如下格式(常用):mov ax,[bx][si]

用 Debug 查看内存,结果如下:

代码语言:javascript
复制
2000:1000 BE 00 06 00 00 00 ……

写出下面的程序执行后,ax、bx、cx中的内容:

代码语言:javascript
复制
mov ax,2000H
mov ds,ax
mov bx,1000H
mov si,0
mov ax,[bx+si]
inc si
mov cx,[bx+si]
inc si
mov di,si
add cx,[bx+di]

解析:

mov ax,[bx+si]

访问的字单元的段地址在 ds 中,(ds)=2000H; 偏移地址= (bx)+(si)=1000H; 指令执行后 (ax)=00BEH

mov cx,[bx+si]: 访问的字单元的段地址在 ds 中,(ds)=2000H; 偏移地址= (bx)+(si)=1001H; 指令执行后 (cx)=0600H

add cx,[bx+di]: 访问的字单元的段地址在 ds 中,(ds)=2000H; 偏移地址= (bx)+(di)=1002H; 指令执行后 (cx)=0606H;  

[bx+si+idata] 和 [bx+di+idata]

[bx+si+idata][bx+di+idata] 的含义相似,以 [bx+si+idata] 为例:

[bx+si+idata] 表示一个内存单元,它的偏移地址为 (bx)+(si)+idata(即 bx 中的数值加上 si 中的数值再加上 idata);

指令 mov ax,[bx+si+idata] 的含义:

将一个内存单元的内容送入 ax,这个内存单元的长度为2字节(字单元),存放一个字,偏移地址为 bx 中的数值加上 si 中的数值再加上idata,段地址在 ds 中。

数学化的描述为:(ax)=( (ds)*16+(bx)+(si)+idata )

该指令也可以写成如下格式(常用):

代码语言:javascript
复制
mov ax,[bx+200+si]  
mov ax,[200+bx+si]  
mov ax,200[bx][si]  
mov ax,[bx].200[si]  
mov ax,[bx][si].200

用 Debug 查看内存,结果如下:

代码语言:javascript
复制
2000:1000 BE 00 06 00 6A 22 ……

写出下面的程序执行后,ax、bx、cx中的内容:

代码语言:javascript
复制
mov ax,2000H
 mov ds,ax
 mov bx,1000H
 mov si,0
 mov ax,[bx+2+si]
 inc si
 mov cx,[bx+2+si]
 inc si
 mov di,si
 mov ax,[bx+2+di]

解析:

mov ax,[bx+2+si] 访问的字单元的段地址在 ds 中,(ds)=2000H; 偏移地址= (bx)+(si)+2=1002H; 指令执行后 (ax)=0006H

mov ax,[bx+2+si] 访问的字单元的段地址在 ds 中,(ds)=2000H; 偏移地址= (bx)+(si)+2=1003H; 指令执行后 (cx)=006AH

mov ax,[bx+2+si] 访问的字单元的段地址在ds中,(ds)=2000H; 偏移地址= (bx)+(si)+2=1004H; 指令执行后 (cx)=226AH;  

不同的寻址方式的灵活应用

如果我们比较一下前面用到的几种定位内存地址的方法(可称为寻址方式),就可以发现有以下几种方式: (1)[iata] 用一个常量来表示地址,可用于直接定位一个内存单元; (2)[bx] 用一个变量来表示内存地址,可用于间接定位一个内存单元; (3)[bx+idata] 用一个变量和常量表示地址,可在一个起始地址的基础上用变量间接定位一个内存单元; (4)[bx+si] 用两个变量表示地址; (5)[bx+si+idata] 用两个变量和一个常量表示地址;

总结:从 [idata] 一直到 [bx+si+idata],我们可以用更加灵活的方式来定位一个内存单元的地址。这使我们可以从更加结构化的角度来看待所要处理的数据。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022-09-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
  • and 和 or 指令
  • 关于 ASCII 码
  • 以字符形式给出的数据
  • 大小写转换的问题
  • [bx+idata]
  • SI 和 DI
  • [bx+si] 和 [bx+di]
  • [bx+si+idata] 和 [bx+di+idata]
  • 不同的寻址方式的灵活应用
相关产品与服务
数据保险箱
数据保险箱(Cloud Data Coffer Service,CDCS)为您提供更高安全系数的企业核心数据存储服务。您可以通过自定义过期天数的方法删除数据,避免误删带来的损害,还可以将数据跨地域存储,防止一些不可抗因素导致的数据丢失。数据保险箱支持通过控制台、API 等多样化方式快速简单接入,实现海量数据的存储管理。您可以使用数据保险箱对文件数据进行上传、下载,最终实现数据的安全存储和提取。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档