Linux Kernel GDB tracepoint module (KGTP)

这个命令将设置一组action当tracepoint num触发的时候执行。如果没有设置num则将设置action到最近创建的tracepoint上(因此你可以定义一个tracepoint然后直接输入actions而不需要参数)。然后就要在后面输入action，最后以end为结束。到目前为止，支持的action有collect，teval和while-stepping。

collect expr1, expr2, ...

当tracepoint触发的时候，收集表达式的值。这个命令可接受用逗号分割的一组列表，这些列表除了可以是全局，局部或者本地变量，还可以是下面的这些参数：

请注意 collect 一个指针(collect ptr)将只能collect这个指针的地址. 在指针前面增加一个 * 将会让action collect指针指向的数据(collect *ptr)。

teval expr1, expr2, ...

当tracepoint触发的时候，执行指定的表达式。这个命令可接受用逗号分割的一组列表。表达式的结果将被删除，所以最主要的作用是把值设置到trace状态变量中 (see 普通trace 状态变量)，而不用像collect一样把这些值存到trace帧中。

while-stepping n

启动和停止 tracepoint

Enable 和 disable tracepoint

和breakpoint一样，tracepoint可以使用GDB命令 "enable" 和 "disable"。但是请注意它们只在tracepoint停止的时候有效。

用tfind选择trace帧缓存里面的条目

tracepoint停止的时候，GDB命令"tfind"可以用来选择trace帧缓存里面的条目。

当GDB在"tfind"模式的时候，其只能显示用collection命令收集的的存在于这个条目中的数据。所以如果打印没有collect的数据例如函数的参数的时候，GDB将输出一些错误信息。这不是bug，不用担心。

如果想选择下一个条目，可以再次使用命令"tfind"。还可以用"tfind 条目ID"去选择某个条目。

如何处理错误 "No such file or directory." 或者 "没有那个文件或目录."

当GDB不能找到Linux内核源码的时候，其就会显示这个错误信息。例如：

你可以用GDB命令 "set substitute-path" 处理它。前面这个例子Linux内核源码在"/build/buildd/test/linux-3.2.0/"但是vmlinux让GDB在"/build/buildd/linux-3.2.0/"找内核远啊，你可以处理他们：

保存trace帧信息到一个文件中

/sys/kernel/debug/gtpframe是一个当KGTP停止时的tfind格式（GDB可以读取它）的接口。

请注意有些"cp"不能很好的处理这个问题，可以用"cat /sys/kernel/debug/gtpframe > ./gtpframe"拷贝它。

显示和存储tracepoint

你可以用GDB命令"save tracepoints filename"保存所有的设置tracepoint的命令到文件filename里。于是你可以在之后用GDB命令"source filename"设置重新这些tracepoint。

删除tracepoint

GDB命令"delete id"将删除tracepoint id。如果"delete"没有参数，则删除所有tracepoint。

用tracepoint从内核中某点取得寄存器信息

用tracepoint从内核中某点取得变量的值

显示当前这一条trace缓存里存储的所有信息

取得 tracepoint 的状态

设置trace缓存为循环缓存

帧缓存默认情况下不是循环缓存。当缓存满了的时候，tracepoint将停止。

下面的命令将设置trace缓存为循环缓存，当缓存满了的时候，其将自动删除最早的数据并继续trace。

GDB断开的时候不要停止tracepoint

默认情况下，当GDB断开KGTP的时候将自动停止tracepoint并删除trace帧。

下面的命令将打开KGTP disconnect-trace。在设置之后，当GDB断开KGTP的时候，KGTP将不停止tracepoint。GDB重新连到KGTP的时候，其可以继续控制KGTP。

kprobes-optimization和tracepoint的执行速度

因为tracepoint是和Linux内核一起执行，所以它的速度将影响到系统执行的速度。

KGTP tracepoint是基于Linux内核kprobe。因为普通kprobe是基于断点指令，所以它的速度不是很快。

但是如果你的arch是X86_64 或者 X86_32 而且内核配置没有打开"Preemptible Kernel" (PREEMPT)，kprobe的速度将被kprobes-optimization (CONFIG_OPTPROBES)提高很多。

请注意一些KGTP的功能会导致tracepoint只能使用普通kprobe即使系统支持kprobes-optimization。文档将在介绍这些功能的时候增加提醒，如果你很介意tracepoint的速度就请避免使用这些功能。

如何使用trace状态变量

TSV可以在tracepoint action和condition中被访问，并且可以直接被GDB命令访问。

请注意 GDB 7.2.1和更晚的版本直接访问trace状态变量，比他们老的GDB只能通过命令"info tvariables"取得trace状态变量的值。

普通trace状态变量

trace状态变量 $c 被创建并初始化0。下面的action将使用$c记录内核里发生了多少次IRQ。

你还可以将某个变量的值传到状态变量里，但是别忘记转化这个值为"uint64_t"。

当使用tfind的时候，你可以分析trace frame buffer。如果trace状态变量被收集了，你可以把它取出来。

需要的时候，访问trace状态变量的tracepoint action将自动加锁，所以其可以很好的处理trace状态变量的竞态条件问题。

Per_cpu trace状态变量

Per_cpu trace状态变量是一种特殊的trace状态变量。当一个tracepoint action访问到其的时候，其将自动访问这个CPU的Per_cpu trace状态变量。

1. 访问Per_cpu trace状态变量的tracepoint actions不存在竞态条件问题，所以其不需要对trace状态变量加锁。所以其在多核的机器上速度更快。

2. 写针对记录某个CPU的tracepoint actions比普通trace状态变量更容易。

如何定义

本地CPU变量

在tracepoint action中访问这个trace状态变量的时候，其将返回这个变量在这个action运行的CPU上的值。

CPU id变量

在tracepoint action或者GDB命令行中访问这个变量的时候，其将返回这个变量在CPU CPI_id 上的值。

下面这个例子可以自动这个这台主机上的每个CPU定义CPU id变量。(请注意用这些命令之前需要让GDB连上KGTP。)

例子1

这个例子定义了一个记录每个CPU调用多少次vfs_read的tracepoint。

例子2

特殊trace状态变量 $current_task，$current_task_pid，$current_thread_info，$cpu_id，$dump_stack，$printk_level，$printk_format，$printk_tmp，$clock，$hardirq_count，$softirq_count 和 $irq_count

KGTP特殊trace状态变量$current_task，$current_thread_info，$cpu_id 和 $clock可以很容易的访问各种特殊的值，当你用GDB连到KGTP后就可以访问到他们。你可以在tracepoint条件和actions里使用他们。

在tracepoint条件和actions里访问$current_task可以取得get_current()的返回值。

在tracepoint条件和actions里访问$current_task_pid可以取得get_current()->pid的值。

在tracepoint条件和actions里访问$current_thread_info可以取得current_thread_info()的返回值。

在tracepoint条件和actions里访问$cpu_id可以取得smp_processor_id()的返回值。

在tracepoint条件和actions里访问$clock可以取得local_clock()的返回值，也就是取得纳秒为单位的时间戳。

$rdtsc只在体系结构是X86或者X86_64的时候访问的到，任何时候访问它可以取得用指令RDTSC取得的TSC的值。

在tracepoint条件和actions里访问$hardirq_count可以取得hardirq_count()的返回值。

在tracepoint条件和actions里访问$softirq_count可以取得softirq_count()的返回值。

在tracepoint条件和actions里访问$irq_count可以取得irq_count()的返回值。

KGTP还有一些特殊trace状态变量$dump_stack，$printk_level，$printk_format 和 $printk_tmp。他们可以用来直接显示值，请看如何让tracepoint 直接输出信息。

下面是一个用$c记录进程16663调用多少次vfs_read并收集thread_info结构的例子：

sys_read() 在CPU0上被执行了3255次，CPU1上执行了1904次。请注意这个例子只是为了显示如何使用$cpu_id，实际上用per_cpu trace状态变量写更好。

特殊trace状态变量 $self_trace

$self_trace和前面介绍的特殊trace状态变量不同，它是用来控制tracepoint的行为的。

默认情况下，tracepoint被触发后，如果current_task是KGTP自己的进程（GDB，netcat，getframe或者其他访问KGTP接口的进程）的时候，其将不执行任何actions。

如果你想让tracepoint actions和任何task的时候都执行，请包含一个包含一个访问到$self_trace的命令到actions中，也就是说增加下面的命令到actions中：

用$kret trace函数的结尾

有时，因为内核是用优化编译的，所以在函数结尾设置tracepoint有时很困难。这时你可以用$kret帮助你。

$kret是一个类似$self_trace的特殊trace状态变量。当你在tracepoint action里设置它的值的时候，这个tracepoint将用kretprobe而不是kprobe注册。于是其就可以trace一个函数的结尾。

请注意这个tracepoint 必须用 "function_name" 的格式设置在函数的第一个地址上。

用 $ignore_error 和 $last_errno 忽略tstart的错误

但有时我们需要忽略这个错误信息并让KGTP工作。例如：如果你在inline函数spin_lock设置tracepoint，这个tracepoint将被设置到很多地址上，有一些地址不能设置kprobe，于是它就会让tstart出错。这时你就可以用"$ignore_error"忽略这些错误。

使用 $cooked_clock 和 $cooked_rdtsc 取得不包含KGTP运行时间的时间信息

访问这两个trace状态变量可以取得不包含KGTP运行时间的时间信息，于是我们可以取得一段代码更真实的执行时间即使这个tracepoint的action比较复杂。

使用 $xtime_sec 和 $xtime_nsec 取得 timespec

访问trace状态变量将返回用getnstimeofday取得的timespec时间信息。

如何 backtrace (stack dump)

每次你的程序做一个函数调用的时候，这次调用的信息就会生成。这些信息包括调用函数的地址，调用参数，局部变量的值。这些信息被存储在我们称为栈帧的地方，栈帧是从调用栈中分配而来。

通过$bt收集栈并用GDB命令backtrace进行分析

因为这个方法更快（只在trace时候收集栈帧信息）而且可以分析出大部分的调用栈中的信息（前面介绍的栈信息都可以分析出来），所以时间你使用这个方法做栈分析。

~~GDB收集栈的通常命令是：在x86_32, 下面的命令将收集512字节的栈内容。~~

KGTP有一个特殊trace状态变量$bt。如果tracepoint action访问到它，KGTP将自动收集$bt长度（默认值是512）的栈。下面这个action将收集512字节的栈内存：

如果你想改变$bt的值，你可以在"tstart"使用下面这个GDB命令：

你还可以看到当你用up，down或者frame来选择调用栈帧的时候，你可以输出不同帧的参数和局部变量。

用$_ret来取得当前函数的调用函数的栈

我们可以看到调用vfs_read的函数是sys_read，函数sys_read的局部变量ret的值是-9。

用 $dump_stack 输出栈分析到printk里

因为这个方法需要在trace的时候分析栈并调用printk，所以它比较慢，不安全，不清晰也不能访问调用栈中的很多内容，所以我建议你使用上一部分介绍的方法

KGTP有一个特殊的trace状态变量$dump_stack，收集这个变量可以令GDB调用栈分析并用printk输出。下面是一个让内核输出vfs_readdir栈分析的例子：

如何让tracepoint直接输出信息

在前面的章节，你可以看到如果想取得Linux内核的信息，你需要用tracepoint "collect" action来保存信息到tracepoint帧中并用GDB tfind命来来分析这些数据帧。

但是有时我们希望直接取得这些数据，所以KGTP提供了一种直接取得这些数据的方法。

切换collect为直接输出数据

KGTP有特殊trace状态变量$printk_level，$printk_format 和 $printk_tmp支持这个功能。

$printk_level，如果这个值是8（这是默认值），"collect" action将是普通行为也就是保存数据到tracepoint帧中。

如果值是0-7，"collect" 将以这个数字为printk级别输出信息，这些级别是：

$printk_format，collect printk将按照这里设置的格式进行输出。这些格式是：

下面是一个显示调用vfs_readdir时的计数，pid，jiffies_64和文件名的例子：

如何用watch tracepoint控制硬件断点记录内存访问

Watch tracepoint 可以通过设置一些特殊的trace状态变量设置硬件断点来记录内存访问。

请注意 watch tracepoint现在只有X86和X86_64支持。而且因为Linux 2.6.26和更老版本有一些IPI的问题，只有Linux 2.6.27和更新版本上可以正常使用动态watch tracepoint。

watch tracepoint的trace状态变量

静态watch tracepoint

当你要监视全局变量或者可以取得地址的变量的值的时候，你可以使用静态watch tracepoint。下面是一个监视jiffies_64写的例子:

动态watch tracepoint

当你要监视局部变量或者只能在函数中取得地址的变量的值的时候，你可以使用动态watch tracepoint。下面是一个监视函数function get_empty_filp中f->f_posf->f_op写的例子:

定义了一个动态watch tracepoint。地址"1"并不是其要监视的地址。其将帮助tracepoint来找到这个动态watch tracepoint。

在函数get_empty_filp中定义一个普通tracepoint，其将开始监视f->f_pos和f->f_op。

在函数file_sb_list_del中定义一个普通tracepoint，其将停止监视file->f_pos和file->f_op。

使用while-stepping让Linux内核做单步

如何使用 while-stepping

当一个actions中包含了“while-stepping n”的tracepoint执行的时候，其将做n次单步并执行while-stepping的actions。例如：

请注意 tracepoint在执行单步的时候会关闭当前CPU的中断。在actions中访问 $step_count 将得到从1开始的这步的计数。

读while-stepping的traceframe

或者你可以将KGTP切换到回放模式，这样GDB可以用执行和反向执行命令选择一个while-stepping tracepoint的traceframe。例如：

设置断点 (只在回放模式下有效，不会影响到Linux内核执行)。

如何显示被优化掉的变量值

这是因为inode和res的值被优化掉了。内核用-O2编译的所以你有时会碰到这个问题。

升级你的GCC

通过分析汇编代码取得访问被优化掉变量的方法

即使升级了GCC，你可能还会遇到问题。主要原因是数据在寄存器中但是GCC没有把信息放到调试信息中。所以GDB只能显示这个变量被又优化掉了。

但你可以通过分析汇编代码取得这个变量在哪并在tracepoint actions中访问其。

下面是一个在函数get_empty_filp中寻找变量"f"并在tracepoint actions中使用其的例子：

现在用"disassemble /m"命令取得和"f"有关的汇编代码和源码并分析他们。

因为"+98"到"+132"的代码因为属于inline函数所以没有在这里显示，但是你可以用"disassemble get_empty_filp"取得他们。

根据汇编代码你可以看到kmem_cache_alloc的返回值在$rax中，其的值被设置到了$rbx中。

设置一个值到f的元素中。汇编代码是设置$r12的值到以$rbx为基础地址的内存中。其让$rbx看起来是"f"。

如何取得函数指针指向的函数

如果函数指针没有被优化掉

如果函数指针被优化掉了

/sys/kernel/debug/gtpframe和离线调试

/sys/kernel/debug/gtpframe是一个当KGTP停止时的tfind格式（GDB可以读取它）的接口。

于是你可以在当前目录找到文件gtpstart和gtpstop，把他们拷贝到你想调试的主机上。

在被调试主机上，先拷贝KGTP目录中的程序"putgtprsp"和"gtp.ko"到这台机器上。insmod gtp.ko之后：

如果要保存trace帧之后再分析，你可以拷贝文件"/sys/kernel/debug/gtpframe"到有GDB的主机上。

请注意有些"cp"不能很好的处理这个问题，可以用"cat /sys/kernel/debug/gtpframe > ./gtpframe"拷贝它。

请注意如果你想在使用离线调试后从远程主机上的GDB连接KGTP，你需要在调用"nc"之前"rmmod gtp"和"insmod gtp.ko"。

如何使用 /sys/kernel/debug/gtpframe_pipe

这个接口提供和"gtpframe"同样的数据，但是可以在KGTP tracepoint运行的时候也可以使用。在数据读出之后，其将自动从trace帧里删除类似ftrace "trace_pipe"。

用GDB读帧信息

这个方法和python一起分析内核比较好，add-ons/hotcode.py就是这样的例子。

用cat读帧信息

用getframe读帧信息

使用 $pipe_trace

为了锁安全，KGTP默认将自动忽略读/sys/kernel/debug/gtpframe_pipe的任务。

如果你真希望trace这个任务而且确定这是安全的，你可以使用"tstart"之前使用下面的命令：

和用户程序一起使用KGTP

KGTP可以在不停止用户程序的情况下，访问内存和trace这个应用层程序。

让GDB为访问用户程序而连接KGTP

2) 如果用户程序在本机运行，则使用GDB命令 "target extended-remote /sys/kernel/debug/gtp" 连接KGTP。如果用户程序运行在远程主机上，则使用类似如果GDB 在远程主机上的方法但是需要将 "target remote" 替换为 "target extended-remote"。

3) 用GDB命令 "file" 装载用户程序 (其必须在编译时候增加GCC参数"-g"保证其有调试信息)。

直接读用户程序的内存

在GDB attach用户程序成功后，你可以用GDB命令"p"和"x"访问到这个task的内存。你可以用GDB命令"help p"和"help x"取得这两个命令的帮助。例如：

Trace用户程序

KGTP用Linux内核功能 uprobes 来trace用户程序，只有Linux内核3.9或者更新版本支持这个功能。

大部分Linux发行版所使用的内核(3.9或者更新版本)的编译选项都打开了 uprobes 。

如果当前Linux内核的 uprobes 是打开的，可以在attach上用户程序后根据 GDB tracepoint 设置tracepoint。例如：

请注意即使你只attach了一个task，用户层tracepoint会在这个用户程序的所有task上上触发。(我认为这是 uprobes 的一个很有趣的特色，所以我没在KGTP tracepoint中对其进行限制。)

你可以在tracepoint conditions中增加对$current_task_pid的检查来让tracepoint只在某task上被触发。下面的例子就是一个设置只在task 985上触发tracepoint上的例子：

同时你还可以在tracepoint actions中增加"collect $current_task_pid"来确定哪个task触发了这个tracepoint。例如：

在tracepoint收集系统调用的从内核到用户层的的栈信息(可用来做backtrace)

$current 是一个特殊trace状态变量。当一个tracepoint的action 访问其的时候，tracepoint将收集当前task的寄存器和内存值而不是内核中的值。

一般来说，tracepoint通过 task_pt_regs 取得寄存器的值。于是在tracepoint actions中collect $current 将让tracepoint访问当前task。例如：

此外，针对一些参数中包含指向当前TASK寄存器指针的特殊函数(例如：X86的do_IRQ函数)，tracepoint需要从函数的参数中取得寄存器信息。则设置指针到 $current 将让tracepoint得到其。例如：

$current_task_user 是一个特殊trace状态变量。当current task 在user模式的时候，其的值为真。

用这两个trace状态变量，就可以用KGTP收集用户程序的栈信息(可用来做backtrace)。

下面这个例子显示如何从用户层到Linux内核层做backtrace(stack dump)：

如何使用 add-ons/hotcode.py

这个脚本可以通过记录并分析中断处理时候的取得的PC值从而得到Linux kernel或者用户层程序的热点代码。

如何增加用C写的插件

API

这两个函数注册和注销插件模块。这样KGTP就可以在访问插件模块资源的时候增加其的引用计数了。

当rmmod插件模块的时候，用这个函数删除gtp_plugin_var_add增加的TSV。

例子

KGTP目录里的plugin_example.c是KGTP plugin的例子，可以用"make P=1"直接编译其。其将增加四个TSV到KGTP中。

如何使用

如何使用性能计数器

性能计数器是大部分现代CPU都有的特殊硬件寄存器。这些寄存器对一些硬件事件进行计数：例如指令执行数量，cachemisses数量，分支预测失败数，而且这些计数不会让应用程序或者内核变慢。其还可以设置到达一定的值的时候发生中断，这些就可以用来分析在某CPU上执行程序的性能。

Linux性能计数器子系统perf event可以用来取得性能计数器的值。你可以用KGTP perf event trace状态变量访问这些值。

请读内核目录里的tools/perf/design.txt文件取得perf event的更多信息。

定义一个perf event trace状态变量

定义一个per_cpu perf event trace状态变量

请注意如果定义一个per_cpu perf event trace状态变量，就不需要在定义cpu id("pe_cpu")因为KGTP已经取得了CPU的ID。

perf event的类型和配置

如果类型是3(PERF_TYPE_HW_CACHE)，配置要分为3部分：第一部分是cache id，其在设置进配置的时候需要 << 0：

第三部分是cache op result id，其在设置进配置的时候需要 << 16：

如果你想取得PERF_COUNT_HW_CACHE_L1I(1), PERF_COUNT_HW_CACHE_OP_WRITE(1) and PERF_COUNT_HW_CACHE_RESULT_MISS(1)你需要使用：

用$p_pe_en打开和关闭一个CPU上所有的perf event

我认为取得一段代码的性能计数器信息比较好的办法是在函数开头打开计数器在函数结束的时候关闭计数器。你可以用"pe_en"设置他们，但是如果你有多个perf event trace状态变量的时候，这样会让tracepoint action很大。$p_pe_en就是处理这种问题的。你可以打开所有perf event trace状态变量在当前CPU上用下面的action：

用来帮助设置和取得perf event trace状态变量的GDB脚本

下面这个GDB脚本定义了2个命令dpe和spe来帮助定义和显示perf event trace状态变量。

你可以把他们存在~/.gdbinit或者你自己的tracepoint脚本中。于是你就可以在GDB中直接使用这2个命令。

附录A 使用KGTP前的准备工作

Linux内核

如果你的系统内核是自己编译的

如果你改了Linux内核config的任何项目，请重新编译你的内核。

如果是Android内核

默认的Android Linux内核config应该不支持KGTP。要使用KGTP，你需要打开下面这些内核选项：

如果你改了Linux内核config的任何项目，请重新编译你的内核。

如果你的系统内核是发行版自带的

Ubuntu

安装Linux内核调试镜像的标准方法

于是你可以在"/usr/lib/debug/boot/vmlinux-$(uname -r)"找到内核调试镜像。

请注意当内核更新的时候这一步安装Linux内核调试镜像 需要再做一次。

安装Linux内核调试镜像的第二方法

如果用标准方法出现问题，请用下面这些命令安装Linux内核调试镜像。

安装内核头文件包

安装内核源码

新方法

老方法

请注意当内核更新的时候这一步 安装内核源码 需要再做一次。

Fedora

安装Linux内核调试镜像

于是你可以在"/usr/lib/debug/lib/modules/$(uname -r)/vmlinux"找到内核调试镜像。

安装Linux内核开发包

请注意在升级过内核包之后，你可能需要重新调用这个命令。

其他系统

确定Linux内核调试镜像是正确的

因为GDB从Linux内核调试镜像里取得地址信息和调试信息，所以使用正确的Linux内核调试镜像是非常重要的。所以在使用KGTP前，请先做检查。

有2个方法进行检查，我建议2个方法都做一次来确保Linux内核调试镜像是正确的。

当前Linux内核调试镜像在哪

在UBUNTU中，你可以在"/usr/lib/debug/boot/vmlinux-$(uname -r)"找到它。

在Fedora中，你可以在"/usr/lib/debug/lib/modules/$(uname -r)/vmlinux"找到它。

如果你自己编译的内核，内核编译目录中的文件“vmlinux”是调试镜像。

使用/proc/kallsyms

在运行着要trace的内核的系统上，用下面的命令取得sys_read和sys_write的地址：

于是我们就可以得到sys_read的地址是0xffffffff8117a520，sys_write的地址是0xffffffff8117a5b0。

之后我们用GDB从Linux内核调试镜像中取得sys_read和sys_write的地址：

sys_read和sys_write的地址一样，所以Linux内核调试镜像是正确的。

使用linux_banner

之后，根据让GDB 连接到KGTP 里的方法连接到KGTP上并再次打印linux_banner。

这个linux_banner是KGTP正在trace的内核的内核信息，如果相同，则Linux内核调试镜像是正确的。

处理Linux内核调试镜像地址信息和Linux内核执行时不同的问题

在X86_32上，用确定Linux 内核调试镜像是正确的介绍的方法发现Linux内核调试镜像地址信息和Linux内核执行时不同，而且确定使用的Linux内核调试镜像是正确的。

这个两个参数的值不同。请注意 "Physical address where the kernel is loaded" 有时不会在配置的时候显示，你可以通过搜索 "PHYSICAL_START" 取得它的值。

你可以通过修改 "Alignment value to which kernel should be aligned" 的值和 "Physical address where the kernel is loaded" 来处理这个问题。

取得KGTP

通过http下载KGTP

通过git下载KGTP

镜像

配置KGTP

下面这部分是在KGTP Makefile里的配置。用这个配置，KGTP将自动和当前系统的内核一起编译。

KERELDIR 设置了你要一起编译的内核，默认情况下，KGTP会和当前的内核一起编译。

请注意这个目录应该是内核编译目录或者linux-headers目录，而不是内核源码目录。内核编译目录只有在编译成功后才能使用。

CROSS_COMPILE 设置编译KGTP的编译器前缀名。留空则使用默认编译器。

或者你可以通过修改KGTP目录里的Makefile选择你要和哪个内核一起编译以及你用什么编译器编译KGTP。

KERNELDIR 设置为 /home/teawater/kernel/bamd64。 Compiler 设置为 x86_64-glibc_std-gcc。

编译KGTP

普通编译

编译错误处理

用一些特殊选项编译KGTP

大部分时候，KGTP可以自动选择正确的参数和和各种版本的Linux内核一起编译。

但是如果你想配置一些特殊选项，可以按照下面的介绍来做：

安装和卸载 KGTP

因为KGTP可以直接在编译目录里insmod，所以不编译后不安装也可以直接使用（见如何让GDB 连接KGTP）。但是如果需要也可以将其安装到系统中。安装：

和DKMS一起使用KGTP

使用KGTP Linux内核patch

大多数时候，你不需要KGTP patch，因为KGTP以一个LKM的形式编译安装更为方便。但是为了帮助人们集成KGTP到他们自己的内核树，KGTP也提供了patch. 在KGTP目录中：

安装可以和KGTP一起使用的GDB

早于7.6版本的GDB的tracepoint功能有一些bug，而且还有一些功能做的不是很好。

所以如果你的GDB小于7.6请到 https://code.google.com/p/gdbt/ 去安装可以和KGTP一起使用的GDB。这里提供UBUBTU, CentOS, Fedora, Mandriva, RHEL, SLE, openSUSE源。其他系统还可以下载静态编译版本。

附录B 如何让GDB连接KGTP

普通Linux

安装KGTP模块

处理找不到"/sys/kernel/debug/gtp"的问题

也许你可能会得到一些错误例如"sysfs is already mounted on /sys"，请忽略他们。

让GDB连接到KGTP

装载Linux内核调试镜像到GDB

GDB在本地主机上

如果GDB在远程主机上

Android

安装KGTP模块

目录 "/" 可能是只读的。你可以选择其他目录或者用命令"sudo adb shell mount -o rw,remount /"把这个目录remount为可写。

处理找不到"/sys/kernel/debug/gtp"的问题

也许你可能会得到一些错误例如"Device or resource busy"，请忽略他们。

GDB连接KGTP

附录C 增加模块的符号信息到GDB

有时你需要添加一个Linux内核模块的符号信息到GDB以其调试之。

手动增加符号信息不太容易，所以KGTP包里包含了GDB Python脚本"getmod.py"和程序"getmod"可以帮到你。

如何使用getmod

"getmod" 是用C写的所以你可以把它用在任何地方即使是一个嵌入式环境。

如果你使用远程调试或者离线调试，你可以需要修改基本目录。下面是一个例子：

功能	GDB调试普通程序	GDB控制KGTP调试Linux内核
准备工作	系统里安装了GDB。程序用 "-g"选项编译。	快速配置和启动KGTP
Attach	使用命令"gdb -p pid"或者GDB命令"attach pid"可以attach系统中的某个程序.	快速配置和启动KGTP
Breakpoints	GDB命令"b place_will_stop"，让程序在执行这个命令后执行，则程序将停止在设置这个断点的地方。	KGTP不支持断点但是支持tracepoint。Tracepoints可以被看作一种特殊的断点。其可以设置在Linux kernel中的一些地方然后定义一些命令到它的action中。当tracepoint开始的时候，他们将会在内核执行到这些地方的时候执行这些命令。当tracepoint停止的时候，你可以像断点停止程序后你做的那样用GDB命令分析tracepoint得到的数据。区别是断点会停止程序但是KGTP中的tracepoint不会。请到 GDB tracepoint 看如何使用它。
读Memory	GDB停止程序后(也许不需要)，它可以用GDB命令"print"或者"x"等应用程序的内存。	你可以在tracepoint中设置特殊的action收集内存到trace frame中，在tracepoint停止后取得他们的值。collect expr1, expr2, ... 用tfind选择trace帧缓存里面的条目或者你可以在内核或者应用程序执行的时候直接读他们的内存。在普通模式直接访问当前值
Step 和 continue	GDB可以用命令"continue"继续程序的执行，用CTRL-C停止其。	KGTP不会停止Linux内核，但是tracepoint可以开始和停止。启动和停止 tracepoint 或者用 while-stepping tracepoint记录一定次数的single-stepping然后让KGTP切换到回放模式。这样其就支持执行和方向执行命令了。使用while-stepping让Linux内核做单步
Backtrace	GDB可以用命令"backtrace"打印全部调用栈。	KGTP也可以。如何 backtrace (stack dump)
Watchpoint	GDB可以用watchpoint让程序在某些内存访问发生的时候停止。	KGTP可以用watch tracepoint记录内存访问。如何用watch tracepoint控制硬件断点记录内存访问
调用函数	GDB可以用命令"call function(xx,xx)"调用程序中的函数。	KGTP可以用插件调用内核中的函数。如何增加用C写的插件

名称	普通tracepoint写	普通tracepoint读	静态static tracepoint写	静态static tracepoint读	动态static tracepoint写	动态static tracepoint写
$watch_static	不支持	不支持	如果"teval $watch_static=1"则这个tracepoint是静态watch tracepoint。	不支持	如果"teval $watch_static=0"则这个tracepoint是动态watch tracepoint。	不支持
$watch_set_id	当这个tracepoint要设置一个动态watch tracepoint的时候，设置动态watch tracepoint的ID到$watch_set_id来标明你要设置哪个动态watch tracepoint。	不支持	不支持	不支持	不支持	不支持
$watch_set_addr	当这个tracepoint要设置一个动态watch tracepoint的时候，设置动态watch tracepoint的地址到$watch_set_addr来标明你要设置哪个动态watch tracepoint。	不支持	不支持	不支持	不支持	不支持
$watch_type	当这个tracepoint要设置一个动态watch tracepoint的时候，设置watch类型到$watch_type。 0是执行。 1是写。 2是读或者写。	取得这个tracepoint设置到$watch_type里的值。	设置watch tracepoint的类型。	取得这个watch tracepoint的类型。	设置watch tracepoint的默认类型。	取得这个watch tracepoint在实际执行中的类型。
$watch_size	当这个tracepoint要设置一个动态watch tracepoint的时候，设置watch长度到$watch_size。长度是1, 2, 4, 8。	取得这个tracepoint设置到$watch_size里的值。	设置watch tracepoint的长度。	取得这个watch tracepoint的长度。	设置watch tracepoint的默认长度。	取得这个watch tracepoint在实际执行中的长度。
$watch_start	设置地址到动态watch tracepoint($watch_set_addr或者$watch_set_id设置)中并让其开始工作。	取得这次开始的返回值。（其可能会失败因为X86只有4个硬件断点）取得0则成功，小于0则是错误ID。	不支持	不支持	不支持	不支持
$watch_stop	设置地址到$watch_stop将让一个watch这个地址的动态watch tracepoint停止。	取得这次停止的返回值。	不支持	不支持	不支持	不支持
$watch_trace_num	不支持	不支持	不支持	不支持	不支持	设置这个动态watch tracepoint的tracepoint的号码。
$watch_trace_addr	不支持	不支持	不支持	不支持	不支持	设置这个动态watch tracepoint的tracepoint的地址。
$watch_addr	不支持	不支持	不支持	这个watch tracepoint监视的地址。	不支持	这个watch tracepoint监视的地址。
$watch_val	不支持	不支持	不支持	这个watch tracepoint监视的内存的当前值。	不支持	这个watch tracepoint监视的内存的当前值。
$watch_prev_val	不支持	不支持	不支持	这个watch tracepoint监视的内存的修改前值。	不支持	这个watch tracepoint监视的内存的修改前值。
$watch_count	不支持	不支持	不支持	不支持	不支持	这个watch tracepoint会话的一个特殊计数ID。