QEMU安装过程
sudo apt-get install qemu
为内核挂载临时文件系统
首先进入工作目录
rootdir='/path/to/work/dir/'
cd ${rootdir}
下载压缩包到${rootdir}: http://wiki.ldmcbuaa.com/download/attachments/35783861/initramfs.cpio.gz?version=1&modificationDate=1591342743117&api=v2
拷贝linux内核到${rootdir}
cp arch/x86/boot/bzImage ${rootdir}
cp vmlinux ${rootdir}
开始GDB调试
使用以下命令启动qemu
qemu-system-x86_64 \
-m 2048 \
-kernel linux-5.4.39-ori/arch/x86/boot/bzImage \
-initrd initramfs.cpio.gz \
-s -S \
-nographic -serial mon:stdio \
-append "console=ttyS0 nokaslr"
选项说明
-m 指定内存数量
-kernel 指定 bzImage 的镜像路径
-s 等价于 -gdb tcp::1234 表示监听 1234 端口,用于 gdb 连接
-S 表示加载后立即暂停,等待调试指令。不设置这个选项内核会直接执行
-nographic 以及后续的指令用于将输出重新向到当前的终端中,这样就能方便的用滚屏查看内核的输出日志了。
-append nokaslr是传递给内核的参数。表示禁用kaslr(Kernel Address Space Layout Randomization) 。
最后这个kaslr很关键,否则话kernel加载到内存后他的地址会进行随机化,这样gdb任务的地址和kernel实际的加载地址就不一致,会导致断点完全不工作。我没少耗费时间在这个坑里。
2.打开一个新的窗口,并进入${rootdir},执行以下命令:
gdb vmlinux
进入gdb命令行后,执行命令:
set arch i386:x86-64:intel
设置完 arch 后,连接:
target remote :1234
连接上后就可以看到 gdb 正常的输出 start_kernel 处的代码,然后按照 gdb 的调试指令进行内核调试即可。
GDB调试方法
一、显示源代码
list <linenum>
显示程序第linenum行的周围的源程序。
list <function>
显示函数名为function的函数的源程序。
list
显示当前行后面的源程序。
list -
显示当前行前面的源程序。
一般是打印当前行的上5行和下5行,如果显示函数是是上2行下8行,默认是10行,当然,你也可以定制显示的范围,使用下面命令可以设置一次显示源程序的行数。
set listsize <count>
设置一次显示源代码的行数。
show listsize
查看当前listsize的设置。
list命令还有下面的用法:
list <first>, <last>
显示从first行到last行之间的源代码。
list , <last>
显示从当前行到last行之间的源代码。
list +
往后显示源代码。
一般来说在list后面可以跟以下这们的参数:
<linenum> 行号。
<+offset> 当前行号的正偏移量。
<-offset> 当前行号的负偏移量。
<filename:linenum> 哪个文件的哪一行。
<function> 函数名。
<filename:function> 哪个文件中的哪个函数。
<*address> 程序运行时的语句在内存中的地址。
二、搜索源代码
不仅如此,GDB还提供了源代码搜索的命令:
forward-search <regexp>
search <regexp>
向前面搜索。
reverse-search <regexp>
全部搜索。
其中,<regexp>就是正则表达式,也主一个字符串的匹配模式,关于正则表达式,我就不在这里讲了,还请各位查看相关资料。
三、指定源文件的路径
某些时候,用-g编译过后的执行程序中只是包括了源文件的名字,没有路径名。GDB提供了可以让你指定源文件的路径的命令,以便GDB进行搜索。
directory <dirname ... >
dir <dirname ... >
加一个源文件路径到当前路径的前面。如果你要指定多个路径,UNIX下你可以使用“:”,Windows下你可以使用“;”。
directory
清除所有的自定义的源文件搜索路径信息。
show directories
显示定义了的源文件搜索路径。
四、源代码的内存
你可以使用info line命令来查看源代码在内存中的地址。info line后面可以跟“行号”,“函数名”,“文件名:行号”,“文件名:函数名”,这个命令会打印出所指定的源码在运行时的内存地址,如:
(gdb) info line tst.c:func
Line 5 of "tst.c" starts at address 0x8048456 <func+6> and ends at
0x804845d <func+13>.
还有一个命令(disassemble)你可以查看源程序的当前执行时的机器码,这个命令会把目前内存中的指令dump出来。如下面的示例表示查看函数func的汇编代码。
(gdb) disassemble func
遇见问题记录
Remote ‘g’ packet reply is too long 错误的原因
这个错误是当目标程序执行时发生模式切换(real mode 16bit -> protected mode 32bit -> long mode 64bit)的时候,gdb server(此处就是 qemu)发送了不同长度的信息,gdb 无法正确的处理这种情况,所以直接就报错。
此时需要断开连接并切换 gdb 的 arch (i386:x86-64 和 i386:x86-64:intel ),arch 变化后,gdb 会重新设置缓冲区,然后再连接上去就能正常调试。这个方法规避了一些麻烦,但是实际上有两种正规的解决方案:
(1) 修改 gdb 的源码,使 gdb 支持这种长度变化(gdb 开发者似乎认为这个问题应该由 gdb server 解决)。
(2) 修改 qemu 的 gdb server,始终发送 64bit 的消息(但是这种方式可能导致无法调试 real mode 的代码)。