STM32调试中的HardFault问题

type

status

date

slug

summary

背景：

用 Keil 进行Debug时，有时候点运行会发现程序跑飞了，点击停止运行，发现程序停在HardFault_Handler函数里的死循环，这说明stm32出现了硬件错误。

STM32触发HardFault一般就几种原因：

内存溢出或访问越界

非法内存访问：访问未分配的内存区域或是只读存储区
访问野指针
数组越界

栈溢出

定位错误代码办法：

一、手动栈回溯

进入HardFault后，查看左侧Registers Window窗口，在寄存器查看窗口查找R14(LR)的值。

如果R14(LR) = 0xFFFFFFE9，继续查看MSP（主堆栈指针）的值；

如果R14(LR) = 0xFFFFFFFD，继续查看PSP（进程栈指针）的值。

以上这么做的原因如下（展开折叠）

在Cortex_M3权威指南中可以看到如下图所示：

发生异常之后可首先查看LR寄存器中的值，确定当前使用堆栈为MSP或PSP，然后找到相应堆栈的指针，并在内存中查看相应堆栈里的内容。

这里解释一下关于 LR 寄存器的工作原理：

如上所述，当 Cortex-M4 处理器接受了一个异常后，寄存器组中的一些寄存器值会被自动压入当前栈空间里，这其中就包括链接寄存器（LR ）。这时的 LR 会被更新为异常返回时需要使用的特殊值（EXC_RETURN）。

关于EXC_RETURN 的定义如下，其为 32 位数值，高 28 位置 1，第 0 位到第三位则提供了异常返回机制所需的信息，如下表所示。可见其中第 2 位标示着进入异常前使用的栈是 MSP还是PSP。在异常处理过程结束时，MCU 需要根据该值来分配 SP 的值。这也是本方法中用来判断所使用堆栈的原理。

我的程序R14(LR) = 0xFFFFFFE9，注意这里R13(SP)的值实际上与MSP的值一致。

Keil菜单栏点击“View”——“Memory Windows”——“Memory1”，在“Address”地址栏中输入MSP的值：

0x200005F8，然后在对应行里找到地址。地址一般以0x08开头的32位数。注意从右往左看。

发生异常后我们可以首先查看LR寄存器的值，确认当前使用的堆栈是MSP还是PSP，然后找到相对应的堆栈指针，并在内存中查看相对应堆栈的内容，内核将R0~R3，R12，LR，PC(Return address)，xPRS寄存器依次入栈，其中堆栈后第25个字节到28字节PC(Return address)即为发生异常前PC将要执行的下一条指令地址。

💡

LR存储的是函数的返回地址，即函数被调用完后的下一条指令地址。而PC存储的是下一条即将要执行的指令的地址

本例中，LR地址为0x08000E49,PC地址为0x08000E48:

设置后如下图：

【补充】

从Memory1中可以看到0x200005F8开始的第一个32位值就对应了R0的值，后面也分别对应了R1，R2，R3，R12

随后在Keil菜单栏点击“View”——“Disassembly Window”（这个反汇编窗口一般默认已经开启），在“Disassembly”窗口中右击，在下拉菜单中选择“Show Disassemblyat Address…”。在弹出框“Show Code atAdress”的地址框中输入地址0x08000E49进行搜索，然后就会找到相对应的代码。这里的代码就是进入循环中断之前的情况。仔细查看附近区域的相关代码来排查错误具体原因。