如何用 gdb 调试多任务程序

栏目: C · 发布时间: 5年前

微信公众号 知识星球

关注 @泰晓科技

订阅 Linux 原创

与同行一起成长

如何用 gdb 调试多任务程序
Zhizhou Tian May 01, 2019 

背景介绍

gdb 调试多任务程序时会有些麻烦: fork 之后没法同时跟踪父进程和子进程,如果在子进程里设置了一个 breakpoint,那么子进程将会收到一个 SIGTRAP 信号并退出。 gdb 手册 里提到了一种小技巧,那就是在想要插入 breakpoint 的位置添加 sleep() 调用。但经过笔者试验,添加以下代码更加适合:

static volatile int hold = 1;
while (hold) ;

然后,重新编译程序并执行。这样,当程序运行到 while 位置的时候就会循环在那里,接下来就可以调试了。

调试步骤

多任务基本调试步骤如下:

ps -ef | grep xxx
info threads
thread xx
set hold=0

如果发生了进程间通信,数据流从 A 发送往 B 了,此时便可以采取上述方法,同时跟踪 A 和 B。每次发生了 pipe/socket 通信,就重复上述步骤。通过这种方式,一些很复杂的多任务程序也可以清晰调试。

调试案例

Libvirt 是用于管理虚拟化平台的开源的 API,后台程序和管理工具。它可以用于管理 KVM、Xen、VMware ESX,QEMU 和其他虚拟化技术。

接下来以 libvirt 的分析过程为例来介绍 gdb 的多任务调试。

libvirt 的基本操作和大概结构是这样的:

  • libvirt 组件有一个 shell,被称为 virsh,提供类似 shell 的界面,可以输入 start、shutdown 等命令操作虚拟机

  • libvirt 有一个守护进程,libvirtd,其对 virsh 的命令做出响应
    • 以 non-root 执行 virsh start 时,将以 qemu://session 的方式运行。libvirtd 将启动一个 non-root 的子进程来与 virsh 进行 socket 通信
    • 以 root 执行 virsh start 时,将以 qemu://system 方式运行,libvirtd 直接与 virsh 进行 socket 通信
  • 无论是上述哪种方式,都会创建多个(一般16个)线程,该线程的的作用是将 socket 传递过来的各个命令和配置进行解析,最终形成一个 cmd。

  • 子线程会将 cmd 通过 pipe 传递给 libvirtd,libvirtd 会 fork 出一个子进程,并 exec cmd

但如果我们想弄清楚 virsh 启动 qemu 的全过程的细节,即在 virsh 里敲入 start xxx_domain,到 exec qemu bin,这中间究竟发生了什么细节呢?这就必须要 gdb 调试了。可以想象,这过程中必定有大量的进程间通信(socket、pipe),这时就出现了文章开头说明的问题:当前 thread 将数据流发给了另外的 thread,而另外的 thread 却没法跟踪并停止。

  1. 我们通过 log 大概知道了 qemuProcessStart 是启动的必经之路,因此在这个函数里添加代码:

    int
     qemuProcessStart(virConnectPtr conn, unsigned int flags)
     {
     ...
         static volatile int hold = 1;
         while (hold) ;
     }
  2. 重新编译、安装、重启 libvirtd

    # make && make install
     # service libvirtd restart
  3. 跟踪 libvirtd

    # ps -ef | grep libvirtd
     root     16529     1  0 16:34 ?        00:00:00 /usr/local/sbin/libvirtd --listen
    
     # gdb  /usr/local/sbin/libvirtd 16529
  4. 在其他的 console 里启动虚拟机

    # virsh start xxx
  5. 按下 Ctrl+c 停止 gdb,查看所有 threads:

    (gdb) info threads
       Id   Target Id         Frame
       15   Thread 0x7f915bccd700 (LWP 16531) "libvirtd" 0x00007f9156ba3296 in qemuProcessStart (conn=conn@entry=0x7f914c1056e0, flags=flags@entry=1)
     ...
     * 1    Thread 0x7f916325d840 (LWP 16529) "libvirtd" 0x00007f9160c0ca4d in poll () from /lib64/libc.so.6
     (gdb)
  6. 切换到 thread 15,set hold=0

    (gdb) thread 15
     [Switching to thread 15 (Thread 0x7fb9ac921700 (LWP 27260))]
     #0  qemuProcessStart (conn=conn@entry=0x7fb97c000aa0, driver=driver@entry=0x7fb99c00da90, vm=vm@entry=0x7fb99c00b910, updatedCPU=updatedCPU@entry=0x0,
         asyncJob=asyncJob@entry=QEMU_ASYNC_JOB_START, migrateFrom=migrateFrom@entry=0x0, migrateFd=migrateFd@entry=-1, migratePath=migratePath@entry=0x0,
         snapshot=snapshot@entry=0x0, vmop=vmop@entry=VIR_NETDEV_VPORT_PROFILE_OP_CREATE, flags=flags@entry=1) at qemu/qemu_process.c:5878
     5878        while (hold)
     (gdb) set hold=0

接下来就可以继续调试下去了。

通过这种办法就可以得知整个过程。以下是通过重复上述步骤获取到的知识:

  • 子线程将 cmd 通过 pipe 传递给 libvirtd

    (gdb)
      #0  virCommandHandshakeNotify (cmd=cmd@entry=0x7f6e4400fa40) at util/vircommand.c:2757
      #1  0x00007f6e5e7666cd in qemuProcessLaunch (conn=conn@entry=0x7f6e500009a0, driver=driver@entry=0x7f6e54000e80, vm=vm@entry=0x7f6e54012ec0,
          asyncJob=asyncJob@entry=QEMU_ASYNC_JOB_START, incoming=incoming@entry=0x0, snapshot=snapshot@entry=0x0, vmop=vmop@entry=VIR_NETDEV_VPORT_PROFILE_OP_CREATE,
          flags=flags@entry=17) at qemu/qemu_process.c:5685
    
    
    
      2729 int virCommandHandshakeNotify(virCommandPtr cmd)
      ...
      2749     if (safewrite(cmd->handshakeNotify[1], &c, sizeof(c)) != sizeof(c)) {
      2750         virReportSystemError(errno, "%s", _("Unable to notify child process"));
      2751         VIR_FORCE_CLOSE(cmd->handshakeNotify[1]);
      2752         return -1;
      2753     }
      ...
      2756 }
  • libvirtd 收到 cmd 后,会执行 virExec,

    #0  virExec (cmd=cmd@entry=0x7f72bc0026d0) at util/vircommand.c:491
      #1  0x00007f72d2219b07 in virCommandRunAsync (cmd=cmd@entry=0x7f72bc0026d0, pid=pid@entry=0x0) at util/vircommand.c:2452
      #2  0x00007f72d221a0c4 in virCommandRun (cmd=cmd@entry=0x7f72bc0026d0, exitstatus=exitstatus@entry=0x7f72c29fab64) at util/vircommand.c:2284
      #3  0x00007f72d222c166 in virFirewallCheckUpdateLock (lockflag=lockflag@entry=0x7f72d26768a3 <iptablesUseLock>, args=args@entry=0x7f72c29fabc0) at util/virfirewall.c:124
      ...
      #20 0x00007f72d072035d in clone () from /lib64/libc.so.6
  • virExec() 将会 fork 出子进程,子进程将会执行 exec(qmeu-system-x86_64)

    475 virExec(virCommandPtr cmd)
      ...
      749      if (cmd->uid != (uid_t)-1 || cmd->gid != (gid_t)-1 || cmd->capabilities || (cmd->flags & VIR_EXEC_CLEAR_CAPS)) {
      753         if (virSetUIDGIDWithCaps(cmd->uid, cmd->gid, groups, ngroups,
      ...
      790     if (cmd->env)
      791         execve(binary, cmd->args, cmd->env); <--- 启动了qemu
      ...

在执行了 execve 之后,当前父进程就会结束退出了。如果想要继续跟踪子进程 qemu,那么仍然需要重复上述过程。

libvirt 分析小结

我们以一张流程图来展示整个 libvirt 启动 qemu 的过程 如何用 gdb 调试多任务程序

抛砖引玉

在 Windows 调试工具 windbg 上,用户可以选择子进程在创建后,wait 并等待用户调试,从而省去了上述麻烦。gdb 是不是可以引入这个特性呢?

附录

GDB online doc – Fork.html :

On most systems, GDB has no special support for debugging programs which create additional processes using the fork function. When a program forks, GDB will continue to debug the parent process and the child process will run unimpeded. If you have set a breakpoint in any code which the child then executes, the child will get a SIGTRAP signal which (unless it catches the signal) will cause it to terminate. 
However, if you want to debug the child process there is a workaround which isn’t too painful. Put a call to sleep in the code which the child process executes after the fork. It may be useful to sleep only if a certain environment variable is set, or a certain file exists, so that the delay need not occur when you don’t want to run GDB on the child. While the child is sleeping, use the ps program to get its process ID. Then tell GDB (a new invocation of GDB if you are also debugging the parent process) to attach to the child process (see Attach). From that point on you can debug the child process just like any other process which you attached to. 

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

颠覆医疗

颠覆医疗

[美]埃里克·托普 / 张南、魏薇、何雨师 / 译言·东西文库/电子工业出版社 / 2014-1-20 / 55.00

“创造性破坏”是奥地利经济学家约瑟夫·熊彼特最著名的理论,当一个产业在革新之时,都需要大规模地淘汰旧的技术与生产体系,并建立起新的生产体系。电器之于火器、汽车之于马车、个人计算机之于照排系统,都是一次又一次的“创造性破坏”,旧的体系完全不复存在,新的体系随之取代。 “创造性破坏”已经深深地改变了我们的生活,在这个数字时代,我们身边的一切都被“数字化”了。只有一处,也许是由于其本身的根深蒂固,......一起来看看 《颠覆医疗》 这本书的介绍吧!

JS 压缩/解压工具
JS 压缩/解压工具

在线压缩/解压 JS 代码

在线进制转换器
在线进制转换器

各进制数互转换器