Linux：断点原理与实现

栏目: IT技术 · 发布时间: 6年前

内容简介：从事编程工作的我们，总有调试的时刻，不管是通过 IDE 调试开发中的代码，还是通过 GDB 排查正在运行的进程。特别是经常使用 GDB 的童鞋，对它提供的强大功能更加如数家珍，其中就不乏刚好最近做到

前言

从事编程工作的我们，总有调试的时刻，不管是通过 IDE 调试开发中的代码，还是通过 GDB 排查正在运行的进程。

特别是经常使用 GDB 的童鞋，对它提供的强大功能更加如数家珍，其中就不乏 breakpoint（断点） 。

刚好最近做到 Ptrace 相关的实验，也顺便撸了这篇小文来分享下断点当中的道理。

简单 GDB 示范

// test.cpp

#include<iostream>
#include<unistd.h>

void test1(){
    std::cout << "test" << std::endl;
}

int main() {
    while (true) {
        std::cout << "main: " << getpid() << std::endl;
        test1();
        sleep(1);
    }
    return 0;
}

编译运行

g++ -std=c++11 test.cpp && ./a.out

// 输出
main: 22346
test
main: 22346
test
main: 22346
...

开启 GDB，并且在 test1 函数断点

sudo gdb a.out -p 22346

// 输出
... (省略打印的信息, 直接输入命令)

(gdb) break test1       // 在 test1 函数断点
Breakpoint 1 at 0x40091a

(gdb) c                 // 继续运行
Continuing.

Breakpoint 1, 0x000000000040091a in test1() ()

(gdb) i r rip           // 查看 cpu 下一条指令的内容
rip            0x40091a 0x40091a <test1()+4>

回头看 a.out 的输出，可以看到已经停在 main: 5693 不再打印了，而进程状态也变成了 T :

Linux：断点原理与实现

T 状态意味着： (TASK_STOPPED or TASK_TRACED)，暂停状态或跟踪状态 ，接下来就可以通过 GDB 实现各种调试的操作了。

我们这次也要实现类似的效果，不过只是一个超简化版本，只考虑： 在指定的位置暂停，获得进程的控制权 。

前置知识准备

在实现之前，我们需要了解下必要的知识：

寄存器：RIP

如果之前没有了解寄存器的童鞋可以先看看： https://www.jianshu.com/p/029...

直接摘抄里面的一段描述：

rip 指令地址寄存器，用来存储 CPU 即将要执行的指令地址。

每次 CPU 执行完相应的汇编指令之后，rip 寄存器的值就会自行累加；

Ptrace

如果之前没有了解 Ptrace 的童鞋可以先看看： http://fancy-blogs.com/2018/0...

在ptrace中有两个角色：

tracee：被追踪者，它是被监控的进程，通过ptrace系统调用的操作作用在它之上（譬如：上文的 22346 进程）；
tracer：追踪者，它负责监视并处理被追踪者传来的信息（譬如：GDB）；

下文会直接引用这两个名词。

实现思路

实现的思路非常简单

1. 先确定我们要断点的地址

在 GDB 中，我们是习惯对行号或者 函数名 直接设置断点，行号相对来说比较复杂，我们先展示 函数名 的。

在 Linux 环境下编译出来的可执行文件都是遵循 ELF 格式，如果没有特殊处理，它会保留比较完整的 符号表 。

就拿开头的程序来当例子，可以通过 readelf -s a.out 查看：

Linux：断点原理与实现

这个符号表记录了进程需要用到的符号分别在什么位置。

如图，第一列就是符号的 地址(十六进制) ，第二列是长度，最后一列是 符号名字 。

我们这里需要在 test1 这个函数打断点，也就是红色圈出来的地方，这里可能会有童鞋想问为啥是： _Z5test1v

这里主要是 cpp 的名字修饰问题： https://blog.csdn.net/u013220... ，不碍事。

我们现在可以看到前面的地址就是 0x400916 ;

2. 通过 Ptrace 获得 tracee 的控制权

// 建立追踪的关系, 很多童鞋可能会用 PTRACE_ATTACH，它和 PTRACE_SEIZE 的区别就是，它会马上暂停 tracee，而 PTRACE_SEIZE 不会
ptrace(PTRACE_SEIZE, pid, addr, data) 

// 中断 tracee 的行为，将控制权交给 tracer
ptrace(PTRACE_INTERRUPT, pid, addr, data)       

// 感知 tracee 的状态变更，便于下一步操作
waitpid(pid, &status, options)

3. 保留当前 rip 的指令内容，并用中断指令替换

// 获取 tracee addr 内存的内容
ptrace(PTRACE_PEEKDATA, pid, addr, data)  

// 修改 tracee 指定内存的内容
ptrace(PTRACE_POKEDATA, pid, addr, data) 

// 获取 tracee 当前的寄存器内容
ptrace(PTRACE_GETREGS, pid, addr, data) 
  
// 设置 tracee 当前的寄存器内容
ptrace(PTRACE_SETREGS, pid, addr, data)

4. 恢复运行，等待 trap 触发

// 让 tracee 继续运行  
ptrace(PTRACE_CONT, pid, addr, data)

5. 恢复 rip 指令，结束调试

完整 Tracer 代码

#include <sys/ptrace.h>
#include <iostream>
#include <stdio.h>
#include <sys/user.h>
#include <sys/wait.h>
#include <string>

void dowait(pid_t pid) {
    int status, signum;
    while (true) {
        waitpid(pid, &status, 0);
        if (WIFSTOPPED(status)) {
            signum = WSTOPSIG(status);
            if (signum == SIGTRAP) {
                break;
            } else {
                std::cout << "Other signum, skipping..." << std::endl;
                ptrace(PTRACE_CONT, pid, 0, 0);
            }
        }
    }
}


void break_onece(pid_t pid, long addr) {

    // 保存 addr 旧的指令和寄存器（主要是 rip）
    long old_code = ptrace(PTRACE_PEEKDATA, pid, addr, NULL);
    user_regs_struct old_regs;
    ptrace(PTRACE_GETREGS, pid, NULL, &old_regs);


    long trap_code = old_code;
    unsigned char *p = (unsigned char*) &trap_code;

    // Trap 中断指令的十六进制数值
    p[0] = 0xcc;

    // 用 Trap 覆盖 addr 数值，等 cpu 执行至此就会中断
    if (ptrace(PTRACE_POKEDATA, pid, addr, trap_code)) {
        std::cout << "Break failed" << std::endl;
        return;
    }

    ptrace(PTRACE_CONT, pid, NULL, NULL);
    dowait(pid);

    // 敲入任意字符以继续，可以在此加入其它调试逻辑（海阔凭鱼跃！！！）
    std::cout << "Next ? " << std::endl;
    std::string instruction;
    std::cin >> instruction;

    // 恢复 rip, 否则会因缺乏有效 rip 导致 tracee coredump
    ptrace(PTRACE_SETREGS, pid, NULL, &old_regs);

    // 恢复 addr 原值
    ptrace(PTRACE_POKEDATA, pid, addr, old_code);
    ptrace(PTRACE_CONT, pid, 0, 0);
}

void quit(pid_t pid) {
    ptrace(PTRACE_DETACH, pid, NULL, NULL);
    std::cout << "quit!" << std::endl;
    exit(0);
}

int main(int argc, char* argv[]) {
    pid_t pid = std::stoi(argv[1]);

    if (ptrace(PTRACE_SEIZE, pid, NULL, NULL)) {
        perror("ptrace_seize failed");
        return -1;
    }

    if(ptrace(PTRACE_INTERRUPT, pid, 0, 0)) {
        perror("interrupt failed");
        quit(pid);
    }

    dowait(pid);

    // 想断点的地址
    long break_addr = 0x400916;
    break_onece(pid, break_addr);

    quit(pid);
    return 1;
}

编译 & 运行

g++ trace_test.cpp -std=c++11 -o trace_test

./trace_test 22346 # 本文开头的进程

总结

关于断点的原理网上有很多文章提到，但比较多也是蜻蜓点水一笔带过，意犹未尽，干脆直接用最浅显的例子降低大家练手

成本！

其实在文中提到的例子也有非常多可以优化的点：

比如：函数地址获取的方式，既然提到 ELF 的符号表，那么应该通过解析这个表，将用户传入的用户名，转换成地址；
再比如：应该维护一份全局的断点表，储存任意多的断点，也让每个断点处可以重复利用；
甚至还比如：涉及到 Ptrace 的错误返回都要优雅处理，因为在每个返回值不为 0 的情况下，贸然进行下一步是非常危险的，非常大可能导致 tracee coredump；

每个比如都可以展开研究，所以欢迎期待后续。

以上就是本文的全部内容，希望本文的内容对大家的学习或者工作能带来一定的帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

Java Web服务：构建与运行

Martin Kalin / 任增刚 / 电子工业出版社 / 2009年11月 / 45.00元

本书以示例驱动的方式详尽地介绍了XML Web服务（JAX-WS）和RESTful Web服务（JAX-RS）二者所涵盖的Java相关API。《Java Web服务：构建和运行》这本书以清晰、务实的方法讲述Web服务相关技术，提供了混合性的架构总结、完全可以运行的代码示例，以及编译、部署和执行应用程序的一些短小精悍的指令。学习本书，读者将掌握如何从零开始编写Web服务或将已有的服务整合到现......一起来看看《Java Web服务：构建与运行》这本书的介绍吧!

码农工具

Linux：断点原理与实现

前言

简单 GDB 示范

前置知识准备

寄存器：RIP

Ptrace

实现思路

1. 先确定我们要断点的地址

2. 通过 Ptrace 获得 tracee 的控制权

3. 保留当前 rip 的指令内容，并用中断指令替换

4. 恢复运行，等待 trap 触发

5. 恢复 rip 指令，结束调试

完整 Tracer 代码

总结

Java Web服务：构建与运行

JS 压缩/解压工具

CSS 压缩/解压工具

UNIX 时间戳转换

Linux：断点原理与实现

前言

简单 GDB 示范

前置知识准备

寄存器：RIP

Ptrace

实现思路

1. 先确定我们要断点的地址

2. 通过 Ptrace 获得 tracee 的控制权

3. 保留当前 rip 的指令内容，并用 中断指令 替换

4. 恢复运行，等待 trap 触发

5. 恢复 rip 指令，结束调试

完整 Tracer 代码

总结

Java Web服务：构建与运行

JS 压缩/解压工具

CSS 压缩/解压工具

UNIX 时间戳转换

3. 保留当前 rip 的指令内容，并用中断指令替换