问题描述
std::vector<std::pair<value_type,size_t>> read_file(const std::string path,benchmark::State& state) {
std::string kmer;
std::vector<std::pair<value_type,size_t>> data;
std::ifstream file(path);
while (std::getline(file,kmer)) {
state.PauseTiming();
kmer_t tmp(kmer);
state.ResumeTiming();
data.push_back(std::make_pair(tmp.value,tmp.index));
}
return data;
}
函数作用域是读取一个文件,逐行转换成一个对象。结果对象被插入到一对向量中。
我在我的项目中包含 google benchmark
库来计算使用了多少时间和内存。我想从总数中排除转换。我像 documentation 所说的那样实现了这个函数,但结果时间比没有计时器管理的正常计算要长得多。
我也发现了这个旧但相关的 opened issue,但我无法解决我的问题。 我该如何解决这个问题,或者有什么办法可以解决这个问题?
解决方法
在这里您无能为力,这是意料之中的。启动和停止计时器需要与操作系统进行某种形式的同步,而在您的情况下,其开销似乎远高于创建临时对象。
不过,这应该不是问题。如果您尝试比较填充向量的几种方法并排除在所有这些方法中创建对象,那么对于所有这些不同的方法,停止和重新启动计时器的开销将相同,因此如果其中一种方法比另一个更快 增加定时器管理开销也会更快,只是相对差异会更小。
我什至会争辩说,在您测量文件的整个解析而不是微基准测试的情况下,例如push_back
与 emplace_back
最好在测量中包含对象创建,以便更准确地了解性能差异的显着性,例如将此版本与在迭代之间重用 kmer_t
对象的版本进行比较时(因此可能重用已为数据成员分配的内存)。