问题描述
我正在尝试了解 linux perf
和 hotspot 以了解我的 C++ 应用程序的调用堆栈/跟踪。
程序应该在调试模式还是发布模式下编译?假设我只有一个文件 inline.cpp
。我在其中一个 example 中看到使用
g++ -O2 -g inline.cpp -o inline
perf record --call-graph dwarf ./inline
我想知道是否有必要在 debug (-g)
和 optimization -O2
中编译程序?编译可执行文件的标志是什么,以便使用 perf 记录运行?
如果我们在没有编译器标志的情况下编译程序会有什么不同吗?
g++ inline.cpp -o inline
解决方法
首先,-g
和 -O2
不是对立的。 -g
指定将生成调试符号,以便您可以将热点与实际代码行相关联。 -O2
指定应该进行代码优化;这通常不会对您打算在调试器中运行的代码完成,因为它会使跟踪执行变得更加困难。
分析器衡量的是可执行文件的性能,而不是源代码的性能。如果您分析未优化的可执行文件,您将看到未优化的可执行文件的性能问题在哪里,但这些问题可能与优化的可执行文件中的问题不同。假设您关心优化的可执行文件的性能(因为它是用户通常会运行的),您应该对其进行分析。使用 -O2
肯定会使更难理解性能问题在哪里,但这只是分析代码的性质。