在下面的文章中,我将使用openmpi v. 1.8.2和选项map-by core,以M字节/s格式给出三位一体测试的结果。源是使用包装器编译的。将基准测试的MPI通信器MPI_COMM_WORLD拆分为两个单独的。一个通信器将与实际运行基准测试的N进程组相关联,另一个通信程序将包含剩余的24-N进程,这些进程的目的只是为了保持内核的忙碌和防止涡轮增压。我还阅读了关于静态修饰符及其对基准测试的影响的讨论。我不确定是否真的有必要打电话给foo。
不幸的是,我的方法并没有导致与基准测试不同的结果。
我正在尝试对一组在C++中实现的较大算法的相对较小部分进行基准测试。除其他外,我希望通过分别测量在foo()和bar()中所花费的总时间来比较这些算法的性能。/测试Call #1 to empty function took 57ns.编辑2: I还在专用机器上运行算法基准测试(Linux,只有系统进程,cpu频率调速器设置为性能)。而且,我也知道,通常在进行这种微基准测试</