如何定位导致Crash的代码位置

 我来答
miniappYoh44tFFDbwZi
2016-01-04 · 请开发者输入账号签名
miniappYoh44tFFDbwZi
采纳数:14074 获赞数:18289

向TA提问 私信TA
展开全部
1. 在开发环境下定位Crash错误
  1.1 普通的crash
    先来看看最普通的crash
    参见图1(c01.png)
    当你在debug模式下运行上面的程序就会弹出上面的框。vc就帮你定位到了错误的位置。是个对零指针的操作。非常简单,不是吗。

  1.2 较难定位的crash
    较难定位的crash往往是由于内存错误(参见5.1 为什么程序crash时调用堆栈是乱的)。例如以下代码:

代码

    char *p = new char[16];
    p[10] = 0xfd;
    delete[] p;
    printf(p);

    以上代码有两处错误,一是第2行的内存写越界,二是第4行使用被删除的指针。
    但以上代码在vc的release和debug下都不会报错。这使得这类错误很难定位。
    检测这一类问题可以使用BoundsChecker工具的FinalCheck模式(BoundsChecker)

    用BoundsChecker检测后可得到两个错误:Write overrun(写越界) 和 Dangling pointer(使用被删除的指针)而且都精确定位到了出错的位置。是个不错的工具。
    参见图2(c02.png)
    参见图3(c03.png)

  1.3 注意vc的输出日志
    由于一些目前未知的原因(有可能是程序的错误太严重或是BoundsChecker本身的bug),BoundsChekcer有时不能正常工作。
    这里vc的输出日志有时能提供一些有用的信息。
    在难找的crash中,有很大一部分是引用了非法的指针。

    有时在vc的输出日志里可以看到类似于这样的信息
    “emule.exe 中的 0x004277b7 处最可能的异常: 0xC0000005: 读取位置 0xfeeeff62 时发生访问冲突 。”
    在缺少BoundsChecker的支持时,这是一条很重要的信息。意思是说在“程序地址0x004277b7处”对“值为0xfeeeff62的指针”进行操作。
    (怎么通过“程序地址0x004277b7”找到对应的代码行可参照 3.1,)
    这条信息的重要性在于,这个操作只会触发一个警告,而不会导致crash,当crash真正发生时,很有可能不会在0x004277b7附近,
    甚至调用堆栈都已经被写乱,让你无从下手。(参见5.1 为什么程序crash时调用堆栈是乱的)

2. 定位发布在外的版本的Crash错误
  发布在外的软件crash了,往往不好调试,所以目前很多软件都有“发送错误报告”这一功能。
  实现这一功能一般分以下几步:

  a. 使用SetUnhandledExceptionFilter函数
    使用SetUnhandledExceptionFilter设置最高一级的异常处理函数,当程序出现任何未处理的异常,都会触发你设置的函数里。具体使用可参照msdn和emule源码。
  b. 使用MiniDumpWriteDump函数
    在你的异常处理函数里,使用MiniDumpWriteDump把错误信息存成特定格式的文件。具体使用可参照msdn和emule源码。
  c. 发送错误报告
    选用一种形式把第二步产生的错误报告(.dmp)文件发送给你指定的地方。
  d. 查看错误报告
    这里介绍用vc查看错误报告的方法,还可以用windows debug tools这个工具看,方法见5.2 使用windows debug tools查看.dmp文件(错误报告)
    
    查看错误报告需要有三样东西:对应release版的代码,当时编译release版所产生的.exe和.pdb文件。(这两个文件都在编译的输出目录里。)所以当程序发布时,要保留下这两个文件。
    把.dmp(错误报告文件), .pdb, .exe. 代码,在同一目录下,用vc打开.dmp 文件。
    按F5运行,程序即到达crash时的状态,可以对其进行相应的分析。
    

  一点补充:当没有“发送错误报告”的功能,或是此功能失效,以致弹出了windows的“发送错误报告”的对话框。这时其实也是有错误报告的,一般在C:Documents and Settings用户名Local SettingsTemp里的一个.dmp文件(一般只有一个.dmp)

3. 小技巧
  3.1 根据程序地址找到代码位置
    可按如下步骤:
    a. 使程序处于停止状态。(比如程序运行时,在vc里按Ctrl+Alt+Break,或设断点使程序停下)
    b. 切换到汇编状态。(Ctrl+F11)
    c. 在地址栏输入程序地址,回车。
    d. 可按Ctrl+F11切回代码模式。
  3.2 根据消息值查看对应的windows消息
    在vc的监视窗口里输入“消息值,wm”即可看到对应的消息。
  3.3 查看GetLastError返回值
    在vc的监视窗口里输入“@err,hr”,即可看到LastError及其解释。
  3.4 在代码中暂停程序
    在debug版中可以在代码中加上“AfxDebugBreak();”以暂停程序。release版可使用 “_asm int 3;”
4. 编程小警示
  4.1 慎用IsBadPtr系列函数
    当使用IsBadReadPtr, IsBadWritePtr, IsBadCodePtr一系列函数时要注意,这一类函数可能并不能达到你所想要的意图。
    比如下面的代码,两个返回都是false。

代码

char *p = new char[10];
bool b;
b = IsBadReadPtr(p+10, 1);
delete[] p;
char *q = new char[10];
b = IsBadReadPtr(p, 1);

    所以切忌在程序中以IsBadPtr函数来判断是否可以对这个指针进行操作。这些函数只能在调试中使用,或是你确切的知道这些函数的返回值表示的是什么意义的时候。

  4.2 慎用catch(...)
    为了防止程序crash或是解决一个不明白的crash时,大家很容易想到一个 try{}catch(...){}来解决问题。
    的确大部分时间这样不会出问题了,但这个try-catch很有可能隐藏掉在try里面的错误,而当由此错误引起其他错误时,就很难追踪到这个问题了。
    所以建议尽量少用catch(...),如果知道某一块代码会抛出异常,应该用确切的写法。比如catch(CFileException *e), catch(int e)等等。

5. 附录
  5.1 为什么程序crash时调用堆栈是乱的
    当内存被写乱时程序很有可能出现很难定位的crash,比如调用堆栈是乱的,或走到不存在的代码里。这里举一例

代码

class CA
{
public:
CA(){}
~CA(){}
virtual f(){}
};

void show()
{
printf("shown");
}

int main()
{
// 对像被创建删除
CA *p = new CA;
delete p;

// 一些正常的操作
int *q = new int;
int codeAddress = (int)show;
*q = (int)&codeAddress;

// 调用被删除的对像,程序有可能执行到任何地方。
p->f();
}

    上面代码的结果会走到show()里显示出show(这跟编译环境有关,vc2003下测试结果是这样)。如果你了解c++的vtable机制就明白这是怎么回事。
    如果不明白也没关系,我下面说个大概。

    首先CA对象被创建又被删除。如果此时调用p->f()多半会crash。
    第二块代码可视为一些正常的操作,new了一个q,然后对它进行了一些赋值。
    如果你不明白vtable机制,那你只要知道,最后一行的 “p->f();”会执行变量q所指向的变量所指向的变量所标示的地址。(这里没打错字,是两个“所指向的变量”)
    这里我“心地善良”的给这个值赋上了一个合法的函数地址show。但实际程序中q所指向的变量有可能是任意值,它再指向的变量就更是任意值了。
    那程序就不知道跑哪里去了。如果这个值过于离谱,那算你运气好,程序会立即crash,而你就知道错误位置在哪了。但讨人厌的是,它有可能是一个合法地址,那程序就继续走下去,
    但迟早会crash,并且调用堆栈面目全非(原因牵涉到“调用堆栈的推导”的问题这里就不多说了),
    到时就根本无从知道原来是调用了被删除的p对象而导致的。

  5.2 使用Debugging tools for windows查看.dmp文件(错误报告)
    a. 准备好程序对应的代码,exe文件,pdb文件(编译时在编译输出目录里)
    b. 安装WinDbg
    c. 在winDbg里把Symbol目录设在.pdb所在目录,Image目录设在.exe所在目录,code目录设到代码目录。
    d. 打开.dmp文件
    e. 输入命令.ecxr。(此命令使环境回到崩溃时的状态)
    f. 打开调用堆栈(ALT + F6)查看Crash的位置
    g. 进行分析
简介
  (FinalCheck能检测出的错误列表见附录1)
  BoundsChecker是一个很强大的调试工具。这里只简单介绍如何用它的FinalCheck模式定位比较难定位的错误。
FinalCheck模式简单来说就是BoundsChecker在你的代码里加一些诊断代码来检查平时比较难查出的内存越界,错误的指针使用等。
不过付出的代价就是程序跑起来会比较慢,所以在不用时最好是把FinalCheck模式关掉。特别是发布前。
金山毒霸
2024-10-31 广告
大部分系统错误,是因为某些DLL文件丢失造成的,比如未安装DirectX9或DirectX 9.0组件已损坏、缺少Visual C ++库、未安装.net库。解决方法如下:一、 手动解决方法1、先确定电脑操作系统是多少位的,现在的电脑一般都... 点击进入详情页
本回答由金山毒霸提供
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式