c – omp订单条款如何工作?

vector<int> v;

#pragma omp parallel for ordered schedule(dynamic,anyChunkSizeGreaterThan1)
    for (int i = 0; i < n; ++i){
            ...
            ...
            ...
#pragma omp ordered
            v.push_back(i);
    }

这填充v与n大小的有序列表.

当达到omp有序块时,所有线程都需要等待最小迭代可能的线程完成,但是如果没有任何线程被指定为特定的迭代呢?或者OpenMP运行时库总是确保最低的迭代由一些线程处理?

另外为什么建议使用ordered子句与动态调度表一起使用?静态时间表会影响性能吗?

解决方法

ordered子句的工作原理如下:不同的线程并发执行,直到它们遇到有序的区域,然后按顺序执行它们将在串行循环中执行的顺序.这仍然允许一定程度的并发性,特别是如果有序区域之外的代码段具有大量的运行时间.

没有特别的理由使用动态调度,而不是具有小块大小的静态调度.这一切都取决于代码的结构.由于有序引入线程之间的依赖关系,如果与认块大小的schedule(静态)一起使用,则第二个线程必须等待第一个线程完成所有迭代,然后第三个线程必须等待第二个线程完成它的迭代(因此也是第一个),等等.可以用3个线程和9个迭代(3个每个线程)轻松地可视化它:

tid  List of     Timeline
     iterations
0    0,1,2       ==o==o==o
1    3,4,5       ==.......o==o==o
2    6,7,8       ==..............o==o==o

=表示线程正在并行执行代码.当线程正在执行有序区域时. .是线程空闲,等待轮到执行有序区域.随着计划(静态,1)将发生以下情况:

tid  List of     Timeline
     iterations
0    0,3,6       ==o==o==o
1    1,7       ==.o==o==o
2    2,5,8       ==..o==o==o

我相信这两种情况的差异都是显而易见的.随着时间表(动态),上面的图片将变得或多或少随机,因为分配给每个线程的迭代列表是非确定性的.它还会增加额外的开销.仅当每次迭代的计算量不同时才需要花费更多的时间进行计算,而不是使用动态调度的额外开销.

不要担心最小的迭代次数.它通常被处理到团队中的第一个线程以便准备执行代码.

相关文章

本程序的编译和运行环境如下(如果有运行方面的问题欢迎在评...
水了一学期的院选修,万万没想到期末考试还有比较硬核的编程...
补充一下,先前文章末尾给出的下载链接的完整代码含有部分C&...
思路如标题所说采用模N取余法,难点是这个除法过程如何实现。...
本篇博客有更新!!!更新后效果图如下: 文章末尾的完整代码...
刚开始学习模块化程序设计时,估计大家都被形参和实参搞迷糊...