当我们去研究一个系统的时候,首先需要从最简单的程序开始入手。前面文章的介绍已经描述了项目的环境搭建以及启动过程。
本文主要从最简单的裸机代码开始分析,让板子的串口可以输出hello world
信息。这篇文章会介绍工程的构建,程序的运行等等一些列的流程,以及树莓派4最后如何输出hello world。在嵌入式开发的过程中,往往都是万事开头难,只有看到了程序正在运行的那一刻,后面的工作也就迎刃而解了。
我们还是以第一个1.compilation_environment的工程作为研究对象。工程的地址在下面的链接中:
https://github.com/bigmagic123/raspi4-bare-metal.git
最后的工程文件如下所示:
我们通过Makefile进行相关工程的构建,使用make生成kernel可执行程序文件。对于这种简单的工程,使用Makefile进行工程的构建是很简单的,对于复杂的工程,可以使用scons或者cmake等更加高级的工具,进行工程的构建。
首先来看一下Makefile中的内容:
SRCS = $(wildcard *.c)
OBJS = $(SRCS:.c=.o)
CFLAGS = -march=armv8-a -mtune=cortex-a72 -Wall -O2 -ffreestanding -nostdinc -nostdlib -nostartfiles
all: clean kernel7.img
start.o: start.S
arm-none-eabi-gcc $(CFLAGS) -c start.S -o start.o
%.o: %.c
arm-none-eabi-gcc $(CFLAGS) -c $< -o $@
kernel7.img: start.o $(OBJS)
arm-none-eabi-ld -nostdlib -nostartfiles start.o $(OBJS) -T link.ld -o kernel7.elf
arm-none-eabi-objcopy -O binary kernel7.elf kernel7.img
clean:
rm kernel7.elf kernel7.img *.o >/dev/null 2>/dev/null || true
分析一下这个文件的细节:
SRCS = $(wildcard *.c)
其中使用wildcard
这个函数来获取当前文件夹中所有的.c文件的列表放在SRCS
目录中。
OBJS = $(SRCS:.c=.o)
该句表示环境变量的替换,就是将SRCS
列表中的所有的.c文件名替换成.o文件名。
all: clean kernel7.img
当使用make
或者make all
的时候,会执行clean
与kernel7.img
对应的命令的指令。
start.o: start.S
arm-none-eabi-gcc $(CFLAGS) -c start.S -o start.o
根据makefile的语法规则这个解释应该是
目标:源
指令
由于前面的定义只定义了C语言的代码,所以这里也需要将汇编语言的编译加进去。
%.o: %.c
arm-none-eabi-gcc $(CFLAGS) -c $< -o $@
其中$<
表示第一个依赖文件的名词,$@
表示目标文件的名词。
kernel7.img: start.o $(OBJS)
arm-none-eabi-ld -nostdlib -nostartfiles start.o $(OBJS) -T link.ld -o kernel7.elf
arm-none-eabi-objcopy -O binary kernel7.elf kernel7.img
通过arm-none-eabi-ld
链接所以的.o文件。arm-none-eabi-objcopy
用于生成在arm平台上运行的可执行程序,另外的作用就是去掉一些符号信息。
clean:
rm kernel7.elf kernel7.img *.o >/dev/null 2>/dev/null || true
用于清理编译过程中的中间文件。
由于程序的编译之后,需要进行链接,link文件告诉了程序链接的规则。下面看一下链接文件的内容:
SECTIONS {
/*
* First and formost we need the .init section, containing the code to
* be run first. We allow room for the ATAGs and stack and conform to
* the bootloader's expectation by putting this code at 0x8000.
*/
. = 0x8000;
.text : {
KEEP(*(.text.boot))
*(.text .text.* .gnu.linkonce.t*)
}
/*
* Next we put the data.
*/
.data : {
*(.data)
}
.bss : {
. = ALIGN(16);
__bss_start = .;
*(.bss*)
*(COMMON*)
__bss_end = .;
}
}
__bss_size = (__bss_end - __bss_start) >> 3;
程序分为代码段(.text),数据段(.data)以及bss段(.bss)。首先将代码段的地址. = 0x8000;
指向0x8000的地址处,因为默认情况下,树莓派默认启动后,会从0x8000这个地址处开始加载程序并启动。KEEP(*(.text.boot))
表示首先将.text.boot
的内容放在第一个地址处,目前开始的地址是0x8000
。需要注意的是.bss段包含的是初始化为零的数据,通过将这些数据放在一个单独的节中,编译器可以在elf文件中省略一些空间。所以需要记录bss_start与bss_end段。并且将这段空间对齐。如果不对齐,一些函数访问的时候,将会出现异常数据。
要想真正的理解CPU的执行代码的流程,必须将自己的当作CPU去执行代码的逻辑。
在start.S文件中,设置了CPU的一些状态,为后续的程序执行准备了环境。
.equ Mode_USR, 0x10
.equ Mode_FIQ, 0x11
.equ Mode_IRQ, 0x12
.equ Mode_SVC, 0x13
.equ Mode_ABT, 0x17
.equ Mode_UND, 0x1B
.equ Mode_SYS, 0x1F
.section ".text.boot"
/* entry */
.globl _start
_start:
/* Check for HYP mode */
mrs r0, cpsr_all
and r0, r0, #0x1F
mov r8, #0x1A
cmp r0, r8
beq overHyped
b continue
overHyped: /* Get out of HYP mode */
adr r1, continue
msr ELR_hyp, r1
mrs r1, cpsr_all
and r1, r1, #0x1f ;@ CPSR_MODE_MASK
orr r1, r1, #0x13 ;@ CPSR_MODE_SUPERVISOR
msr SPSR_hyp, r1
eret
continue:
/* Suspend the other cpu cores */
mrc p15, 0, r0, c0, c0, 5
ands r0, #3
bne _halt
/* set the cpu to SVC32 mode and disable interrupt */
cps #Mode_SVC
/* disable the data alignment check */
mrc p15, 0, r1, c1, c0, 0
bic r1, #(1<<1)
mcr p15, 0, r1, c1, c0, 0
/* set stack before our code */
ldr sp, =_start
/* clear .bss */
mov r0,#0 /* get a zero */
ldr r1,=__bss_start /* bss start */
ldr r2,=__bss_end /* bss end */
bss_loop:
cmp r1,r2 /* check if data to clear */
strlo r0,[r1],#4 /* clear 4 bytes */
blo bss_loop /* loop until done */
/* jump to C code, should not return */
ldr pc, _main
b _halt
_main:
.word main
_halt:
wfe
b _halt
分别来看一下这些代码具体的细节。
.section ".text.boot"
表示该段标志为.text.boot
,这里表示该文件夹会在链接脚本中链接到开头的地址中。然后将_start
指定到0x8000
的地址处。
/* entry */
.globl _start
_start:
/* Check for HYP mode */
mrs r0, cpsr_all
and r0, r0, #0x1F
mov r8, #0x1A
cmp r0, r8
beq overHyped
b continue
overHyped: /* Get out of HYP mode */
adr r1, continue
msr ELR_hyp, r1
mrs r1, cpsr_all
and r1, r1, #0x1f ;@ CPSR_MODE_MASK
orr r1, r1, #0x13 ;@ CPSR_MODE_SUPERVISOR
msr SPSR_hyp, r1
eret
从树莓派启动第一行代码的时候,此时是处于虚拟化模式的,从cpsr_all
寄存器中可以读到当前的状态。此时需要退出虚拟化模式。使其运行在Supervisor
模式。用eret
指令将模式进行切换。
/* Suspend the other cpu cores */
mrc p15, 0, r0, c0, c0, 5
ands r0, #3
bne _halt
因为刚开始的时候,树莓派4是支持4核的,由于当前并不需要这么多核的功能,所以可以让其他的核进入low-power standby低功耗模式WFE(Wait for event)。
/* set the cpu to SVC32 mode and disable interrupt */
cps #Mode_SVC
/* disable the data alignment check */
mrc p15, 0, r1, c1, c0, 0
bic r1, #(1<<1)
mcr p15, 0, r1, c1, c0, 0
接着关闭中断、关闭非对齐检查。为后续的代码运行准备环境。
/* set stack before our code */
ldr sp, =_start
接着设置sp的栈指针,ldr sp, =_start
表示将栈指针设置到_start
段的地址这里,由于布局的时候,将_start
的代码段的地址设置为0x8000
,又因为arm上sp栈指针是向低地址方向增长,sp指向的是栈顶。所以我们可以认为0x8000
地址之前的空间都是未被使用的,可以作为C语言执行的栈空间使用。
/* clear .bss */
mov r0,#0 /* get a zero */
ldr r1,=__bss_start /* bss start */
ldr r2,=__bss_end /* bss end */
bss_loop:
cmp r1,r2 /* check if data to clear */
strlo r0,[r1],#4 /* clear 4 bytes */
blo bss_loop /* loop until done */
接着清空BSS段,BSS段通常是指用来存放程序中未初始化的或者初始化为0的全局变量和静态变量的一块内存区域。特点是可读写的,在程序执行之前BSS段会自动清0。
/* jump to C code, should not return */
ldr pc, _main
然后设置PC指针。使用ldr pc, _main
指令,将_main
函数的指针,指向pc。这样下次再执行PC程序的时候就直接执行main函数了。
在前面的汇编代码中,为C语言代码执行提供了环境,包括关闭非对齐检查、设置了栈SP的地址、清零了BSS段。这些都是为C代码的执行做准备。在C语言中做了具体的业务。由于目前的裸机代码比较的简单,所以业务也比较容易。
#include "uart.h"
void main()
{
// set up serial console
uart_init();
// say hello
uart_puts("Hello World!\n");
// echo everything back
while(1) {
uart_send(uart_getc());
}
}
这个代码就是通过串口输出一个hello world!
,然后在while中不断的读串口的输入。那么重点还是放在树莓派串口的初始化上。
在做嵌入式的时候,我们总是希望设备与自己是有交互的,比如点亮一个led,或者用串口输出一段字符等等。这都表示程序正常运行。所以会写简单的交互程序也非常的重要。一般比较简单的就是led的呼吸灯。这里用串口,可以做人机交互的信息可以更加的丰富。下面我们来分析一下串口的程序的实现。
在写外设的驱动程序之前,首先需要查看芯片的Peripherals manual。这里查看rpi_DATA_2711_1p0.pdf
即可。根据外设空间分布的地址,可以查看如下:
这里由于使用32位的地址空间,根据数据手册,得到芯片的外设的地址的起始地址为0xFE000000
。
如果要使用串口,必须要有两个先决条件:
1.相关的gpio配置成串口复用功能
2.配置串口控制器参数
对于树莓派的gpio,找到对应的地址后,还需要找到其对应的功能。
首先查看树莓派上对应的硬件引脚:
对应的功能如下所示:目前串口使用的硬件引脚为14号与15号引脚。
需要设置的复用功能为ALT5。
有了这些信息之后,就可以配置GPFSEL1
的功能了。
/**
* gpio14 RX gpio15 TX
*/
void uart_gpio_init()
{
register unsigned int r;
/* map UART1 to GPIO pins */
r=*GPFSEL1;
r&=~((7<<12)|(7<<15)); // gpio14, gpio15
r|=(2<<12)|(2<<15); // alt5
*GPFSEL1 = r;
*GPPUD = 0; // enable pins 14 and 15
r=150; while(r--) { asm volatile("nop"); }
*GPPUDCLK0 = (1<<14)|(1<<15);
r=150; while(r--) { asm volatile("nop"); }
*GPPUDCLK0 = 0; // flush GPIO setup
*AUX_MU_CNTL = 3; // enable Tx, Rx
}
在树莓派中,首先需要选择使能哪些引脚,然后配置成什么模式。对着手册查看,就知道设置这些寄存器位的具体含义了。
串口控制器是需要配置的,目前使用的是AUX的串口控制器,也就是使用的mini UART。所以需要配置串口的一些参数信息。比如串口的波特率、位宽、停止位等等。
*/
void uart_init()
{
/* initialize UART1 */
*AUX_ENABLE |=1; // enable UART1, AUX mini uart
*AUX_MU_CNTL = 0;
*AUX_MU_LCR = 3; // 8 bits
*AUX_MU_MCR = 0;
*AUX_MU_IER = 0;
*AUX_MU_IIR = 0xc6; // disable interrupts
*AUX_MU_BAUD = 270; // 115200 baud
uart_gpio_init();
}
目前串口不需要使用中断,所以收发数据都直接从串口的fifo中进行获取。
发送数据
/**
* Send a character
*/
void uart_send(unsigned int c) {
/* wait until we can send */
do{asm volatile("nop");}while(!(*AUX_MU_LSR&0x20));
/* write the character to the buffer */
*AUX_MU_IO=c;
}
判断当前fifo是否有数据,如果没有就发送到串口的fifo。
char uart_getc() {
char r;
/* wait until something is in the buffer */
do{asm volatile("nop");}while(!(*AUX_MU_LSR&0x01));
/* read it and return */
r=(char)(*AUX_MU_IO);
/* convert carrige return to newline */
return r=='\r'?'\n':r;
}
从串口的fifo中读取字符。
从树莓派4的hello world程序分析,详细的描述了串口的输出信息到控制台的过程。前期的c语言运行环境的准备阶段是很多同等系列的芯片都需要去做的事情,后面外设的初始化可能会和具体的硬件平台相关。但是从整体上来看,整个流程还是比较通用的。在不同的芯片与不同的架构上,都需要去做这些基本操作。
本文从最小系统的角度描述了系统启动过程,配置寄存器参数需要对着手册查看,这里也不进行过多的分析,总之多看手册才是学会使用一款芯片的必经之路,只有反复的看,反复的思考理解,才能使用得当。欧阳修《卖油翁》 里说到:无他,但手熟尔。