如何以RGBA格式将两个32位颜色相乘

问题描述

我正在使用 raylib 并且它使用 32 位 RGBA 颜色。我在 cheatsheet搜索,但找不到任何合适的例程。我想要做的是将两种颜色相乘,就好像它们是 opengl 中的 vec4 一样(每个通道的范围从 0 到 1)。我其实已经成功了 执行了乘法,但对于如此简单的事情来说,它涉及大量浮点运算的速度相当慢:

uint8_t multiplyBytes(uint8_t a,uint8_t b) {
    const float invertedByte = 1/255.0;
    return (uint8_t)(((a * invertedByte) * (b * invertedByte)) * 255.0);
}

我的问题是是否有更好的方法来做到这一点?或者我应该坚持这个解决方案?

解决方法

我实际上已经成功地执行了乘法,但是对于如此简单的事情,它涉及大量浮点运算的运算相当缓慢:

改进 FP 数学的一个步骤是避免使用 floatdouble 类型。

// double to float
const float invertedByte = 1/255.0;  

// uint8_t to float (twice)
// float to double
// double to uint8_t
return (uint8_t)(((a * invertedByte) * (b * invertedByte)) * 255.0);
//                ^---- float product ------------------^    double

更好的 FP 解决方案将使用

const float invertedByte = 1.0f/255.0f;  
// unsigned to float (once)
// float to uint8_t
return (uint8_t)( ((unsigned)a * (unsigned)b) * invertedByte);

仍然是一个全整数解 - 类似于 @Jakub Dóka

return (uint8_t) (((unsigned)a * (unsigned)b + 255u) >> 8);

或者按照@Paul Hankin

的建议
return (uint8_t) ((unsigned)a * (unsigned)b + 127u) / 255u;

另见@Ian Abbott好主意

return ((uint_fast32_t)a * (uint_fast32_t)b * 0x10101u + 0x800000u) >> 24;
,

经过一番搜索,我意识到,我可以将其升级为:

uint8_t multiplyBytes(uint8_t a,uint8_t b) {
    return (uint8_t)(((unsigned short)a * (unsigned short)b + 255) >> 8);
}

不确定这是否是最佳解决方案。