事情的起因是我在对 SAT Solver 进行优化测试时，发现了我的求解器测不准时间，具体表现为，我在代码中测试的时间与 gprof 得到的时间不相符，后者的时间要比前者少将近 $20%$ ，实在是让人匪夷所思。

背景知识

一个简单的 SAT Solver，我们以 DPLL 算法为例，其框架如下所示：

1
while(1){
2
  auto conf = bcp();
3
  if(conf){
4
    auto level = backtrack();
5
    if(level < 0){
6
      return UNSAT;
7
    }
8
    flip();
9
  } else {
10
    auto result = decide();
11
    if(result){
12
      return SAT;
13
    }
14
  }
15
}

我们假设这个过程为函数 solve，于是，我们测时间的代码如下：

1
double process_time(void) {
2
  struct rusage u;
3
  double res;
4
  if (getrusage(RUSAGE_SELF, &u)) return 0;
5
  res = u.ru_utime.tv_sec + 1e-6 * u.ru_utime.tv_usec;
6
  res += u.ru_stime.tv_sec + 1e-6 * u.ru_stime.tv_usec;
7
  return res;
8
}
9

10
//! main function
11
auto _start = process_time();
12
solve();
13
auto dur = process_time() - _start;

于是，dur 就是求解的时间

`gprof` 简介

Gprof 是 GNU binutils 工具之一。可以分析出代码中每个函数的调用次数、每个函数消耗的处理器时间等，我们通过在编译选项中加上 -pg 即可开启。

例如：

1
g++ main.cc -pg -O2 -Wall -Werro -o main

随后，运行 ./main 后，会产生一个名为 gmon.out 的文件，我们通过如下命令来解析：

1
gprof -b main gmon.out > profiling.log

即可查看 profiling 的结果。

其工作原理十分简单，主要是利用了插桩，他首先会激活一个名为 mcount 的函数，随后，他会在运行每段函数之前都去调用这个 mcount 来记录此函数的调用次数以及时间，例如，我们在 propagate 函数中：

粗略了解了这些，我们来进行问题的介绍。

测试结果

然而，我们得到的结果如下所示：

1
[bcp] 21.754837395 s [decide] 0.233632646 s [backtrack] 3.439200214 s
2
[time] 56.299 s

然而，gprof 的结果如下所示：

可以发现一个

原因分析

查询了诸多资料，发现有之前有人提出过类似的问题，但时间却已经是 2010 年了，其解决方法都是换一个 profiling 工具，并没有给出这个问题的原因。

由于我们代码的运行时间几乎 $90%$ 都在运行 propagate 函数，因此下面我们只考虑这一部分（测不准的也在这部分）

这里，我给出一个猜测的原因，由于我们的 propagate 代码的写法如下：

1
for(auto &lit : trail){
2
  if((conf = propagate_binary(lit))){
3
    return conf;
4
  } else if((conf = propagate_cnf(lit))){
5
    return conf;
6
  }
7
}

然而，其结果如下所示：

我们统计了 propagate 被调用的次数：

1
[key] 9130372acd411 [time] 799.341 s
2
[bcp count] 331 862 591 [bcp max time] 0.001 [bcp total time] 692.34

于是，我们有一个合理的怀疑：

由于函数调用会有上下文切换的额外开销，在如此之大的函数调用数下，是否大多数的时间都在运行调用栈的开辟与恢复？而由于 gprof 的插桩也只能让我们测试出每个函数的运行时间，反而在切换时的时间会忽略，这是否也是造成 gprof 无法测准时间的一大重要原因？

接着，我们直接手动内联（指人力内联）传播的两个函数，合并为一整个 propagate 函数后，我们发现 gprof 能够测准时间了，并且时间与程序内时间函数测试的一致（并没有减少），但相较于频繁的函数调用，时间还是减少了不少。

结论

在函数调用次数过多，大于 $1 0^{8}$ ，我们推荐不要再使用函数，直接手动内联，否则在函数调用的开销会十分巨大，导致程序速度变慢，且 gprof 无法测准函数运行时间。

また夏を追う

最近的笔记

TAOCP 4B & SAT Handbook 阅读

RoundingSAT 阅读笔记其二

基数约束编码中文字顺序的重要性

探索

gprof 的一些使用指北

背景知识

`gprof` 简介

测试结果

原因分析

结论

🕸️ 关系图谱

目录

反向链接

また夏を追う

最近的笔记

TAOCP 4B & SAT Handbook 阅读

RoundingSAT 阅读笔记其二

基数约束编码中文字顺序的重要性

探索

gprof 的一些使用指北

背景知识

gprof 简介

测试结果

原因分析

结论

🕸️ 关系图谱

目录

反向链接

`gprof` 简介