進階gdb之core dump的除錯
core dump的除錯
Basic Perl等語言處理的可以說是User的資料, C可以說在那邊把資料在記憶體移來移去, 組語可說把資料在暫存器搬來搬去, 越低階的處理表示握有的資源越少
所以C處理不好的話很容易記憶體跨出範圍, 或者系統毀了(panic), 這時都會產生一個core dump, 就是毀掉的瞬間記憶體內部的內容會搬到一個檔案core, core file 包含了程式的read/write的memory部份, 也就是程式躺在記憶體時的狀態, executable只是一個可執行檔也就是程式躺在硬碟時。 gdb可以根據這個檔來除錯,只是這時的target是core 或exec 不是remote。 通常這可以拿來做系統毀掉時的debug
gdb a.out core 命令列上給executable與core file |
用下面程式做例子
#include <stdio.h> |
跑它之後產生core dump檔並用gdb來看它
[cyril@megami cyril]gdb a.out core |
當然這例子很簡單,不過不用自己一步步追到死掉的地方, gdb a.out core自動用file命令load了symbol table進來,所以我可以用 print x來看它。通常捉到問題點就是用bt(backtrace)捉出之前到底叫了甚麼。
產生 core dump 的方法
這篇是 "Learning core dump from the hard way", 寫下幾個注意事項, 後來才發現 man core 就可以看到全部東西:
測試
若執行的程式有讀 terminal input, 可直接輸入 ctrl + \ 送出 SIGQUIT。或用指令 kill -QUIT PID 或 kill -ABRT PID, 要求程式產生 core dump, 藉此測試目前的設定是否 ok。
參考《從 /proc/PID/status 了解執行中程式處理 signal 的方式》, 先確認 signal handler 沒有被覆蓋掉, 才可放心測試。
ulimit / setrlimit(RLIMIT_CORE, ...)
Ubuntu 預設為 ulimit -c 0, 表示不產生 core dump, 所以要先執行 ulimit -c unlimited 允許產生 core dump。可以將這行寫到 ~/.bashrc 裡, 以後就預設會產生 core dump。或在程式裡呼叫 setrlimit(RLIMIT_CORE, &limit) 也可以。
/proc/sys/kernel/core_pattern
預設 core dump 的檔名可能不合使用, 參考《setting the core dump name schema》, 可用
$ echo "core.%e.%p.%t"| sudo tee /proc/sys/kernel/core_pattern
改變 core dump 的檔名, 這樣檔名會記錄是程式名稱、PID、發生的時間。在 multi-process 或 multi-thread 時特別有用。若希望每次開機都會生效, 則要在 /etc/sysctl.conf 加入 kernel.core_pattern = core.%e.%p.%t。
core pattern 可以是 "|PROGRAM", 這樣會將 core dump 導到 PROGRAM 的標準輸入, 可以自己寫 PROGRAM 做控制。像是 core dump 太頻繁時, 取樣留下幾個就好, 以免一下就塞爆硬碟。同樣的, %e 那些參數也可以接在 PROGRAM 後當參數用, 像是 "|PROGRAM core.%e.%p.%t", 自己的 PROGRAM 就能從 argv[1] 裡取得適合的檔名。需要特別注意的是, | 和 PROGRAM 之間不可以有空白。
setuid / setgid
若確認 ulimit -c 有設好, core_pattern 沒寫到奇怪的地方 (像是 /dev/null), 硬碟也仍有空間, 卻仍無法產生 core dump, 可能是用到 setuid。用 ls -l 檢查一下, 或用 strace -esetuid 檢查。Linux 為了安全考量, 在使用 setuid/setgid 後, 會自動禁用 core dump。
若確實有觸發 setuid 的話, 在 setuid 後執行:
prctl(PR_SET_DUMPABLE,1);
重新允許產生 core dump, 應該就 ok 了。
2013-03-26 更新
裝 Ubuntu 12.04 後, 發覺 /etc/sysctrl.conf 的設定沒有生效, 查了一下才發覺 apport 覆寫了 /proc/sys/kernel/core_pattern, 參考這裡關掉它, /etc/sysctrl.conf 的值應該可如預期作用:
$ vi /etc/default/apport # 更新成 "enabled=0"
最新文章
- 懒加载插件- jquery.lazyload.js
- javaScript 将json字符串转换为json对象的方法解析
- 编码Q&;A
- jquery插件lazyload.js延迟加载图片的使用方法
- Coin Test
- Android Studio 单刷《第一行代码》系列 06 —— Fragment 生命周期
- Session和Cookie总结
- windows 10 防火墙设置规则:允许特定ip端口
- 安卓开发笔记——ViewPager组件(仿微信引导界面)
- 并发编程 —— ScheduledThreadPoolExecutor
- Flutter - ListView禁止用户上下滑动
- 使用 RamMap 清理内存 How to Use RamMap to Empty System Working Set
- Java多线程(四) —— 线程并发库之Atomic
- java IO 学习(三)
- 《Shiro框架》shiro学习中报错解决方法
- 基于spring的异常一站式解决方案
- .tar与.gz有什么联系与区别?
- Java内存区域与内存溢出异常---对象的内存布局和对象的访问定位
- 批处理实现虚拟WIFI
- 77%的Linux运维都不懂的内核问题