ios – 我怎样才能将这个for循环向量化?

我有这个循环

void f1(unsigned char *data,unsigned int size) {
    unsigned int A[256] = {0u};      
    for (register unsigned int i = 0u; i < size; i++) {
        ++A[data[i]];
    }
   ...

有没有办法手动矢量化?

解决方法

由于data [i]中的多个条目可能包含相同的值,因此我不知道如何将其简化为矢量化,因为可能存在竞争条件.矢量化的要点是每个元素独立于其他元素,因此可以并行计算.但是你的算法不允许这样做. “Vectorize”与“让自己走得更快”不是一回事.

在这里构建的是一个直方图,iOS内置了优化的支持.您可以创建单通道单行图像,并使用vImageHistogramCalculation_Planar8,如下所示:

void f1(unsigned char *data,unsigned int size) {
    unsigned long A[256] = {0u};

    vImage_Buffer src = { data,1,size,size };
    vImage_Error err = vImageHistogramCalculation_Planar8(&src,A,kvImageDoNottile);
    if (err != kvImageNoError) {
        // error
    }
    ...
}

但是要小心,假设这总是一场胜利.这取决于您的数据大小.进行函数调用非常昂贵,因此可能需要数百万字节的数据才能使其值得.如果你在较小的集合上计算它,那么一个简单的,编译器优化的循环通常是最好的方法.您需要在真实设备上对此进行分析,以确定哪个更快.

只需确保允许编译器通过启用-Ofast(Fastest,Aggressive)来应用所有矢量化优化.在这种情况下,这无关紧要,因为你的循环不能简单地进行矢量化.但通常,-Ofast允许编译器在可能略微增加代码大小的情况下应用矢量化优化(在认的-Os下不允许). -Ofast还允许在执行浮点数学时有点邋so,所以不应该在需要严格的IEEE浮点一致性的情况下使用(但对于iOS应用来说几乎不是这种情况,所以-Ofast几乎总是正确的设置).

相关文章

UITabBarController 是 iOS 中用于管理和显示选项卡界面的一...
UITableView的重用机制避免了频繁创建和销毁单元格的开销,使...
Objective-C中,类的实例变量(instance variables)和属性(...
从内存管理的角度来看,block可以作为方法的传入参数是因为b...
WKWebView 是 iOS 开发中用于显示网页内容的组件,它是在 iO...
OC中常用的多线程编程技术: 1. NSThread NSThread是Objecti...