Arm64有4种栈,分别是空增栈(Empty Ascendant Stack,EA)、空减栈(Empty Descendant Stack,ED)、满增栈(Full Ascendant Stack,FA)、满减栈(Full Descendant Stack,FD)。常用的是满减栈,Linux内核也使用满减栈。
下图是一个满减栈的示意图,高地址为栈顶,低地址为栈低,栈向低地址方向生长,如右边的箭头所示。栈指针SP指向栈底(栈低保存了数据)。每产生一次函数调用,就会在栈中形成一个栈帧,该栈总共保存了4个栈帧(Stack Frame),每个栈帧由FP、LR及栈参数(函数参数、函数局部变量等)组成。可以将栈中的所有栈帧视为一个单项链表,栈最低位置的栈帧为链表头,栈最高位置的栈帧为链表尾,整个链表使用FP索引。栈手动回溯时,可以根据FP将所有栈帧索引出来。
下面是Arm64程序调用标准规定的通用寄存器的使用方法。
下图是内核Oops时打印出的信息。第一张图片是寄存器信息,pc寄存器和sp寄存器对栈回溯有重要作用。第二张图是内核线程irq/231-dwc3栈数据的二进制转储,栈回溯就是在这些二进制数据中找到栈帧,从而找到调用的函数地址。
下图是内核栈回溯的结果,发生异常函数的地址保存在异常栈中,不在内核线程irq/231-dwc3栈中。
发生异常的函数可以根据pc寄存器得到,该函数是栈回溯的第一个函数。sp寄存器指向了第一个栈帧中的FP1寄存器,即0xffffffc0ee823b80地址,FP1向高地址偏移8字节得到LR1寄存器,即0xffffff80087369e4地址,该地址位于dwc3_ep0_stall_and_restart函数内,该函数是栈回溯的第二个函数。FP1指向了第二个栈帧的FP2,根据栈帧找到LR2,依次类推。所有的栈帧最终如下图所示,总共找到7个栈帧,因此irq/231-dwc3内核线程发生异常时总共有8个函数调用,和内核输出的函数调用关系一致。需要注意的是,代码里调用了该函数,但在栈回溯中没有找到符号,肯定是编译器优化,将该函数内联了,是否内联可以通过反汇编确认。