如何以RGBA格式将两个32位颜色相乘

问题描述

我正在使用 raylib 并且它使用 32 位 RGBA 颜色。我在 cheatsheet 中搜索，但找不到任何合适的例程。我想要做的是将两种颜色相乘，就好像它们是 opengl 中的 vec4 一样（每个通道的范围从 0 到 1）。我其实已经成功了执行了乘法，但对于如此简单的事情来说，它涉及大量浮点运算的速度相当慢：

uint8_t multiplyBytes(uint8_t a,uint8_t b) {
    const float invertedByte = 1/255.0;
    return (uint8_t)(((a * invertedByte) * (b * invertedByte)) * 255.0);
}

我的问题是是否有更好的方法来做到这一点？或者我应该坚持这个解决方案？

解决方法

我实际上已经成功地执行了乘法，但是对于如此简单的事情，它涉及大量浮点运算的运算相当缓慢：

改进 FP 数学的一个步骤是避免使用 float 和 double 类型。

// double to float
const float invertedByte = 1/255.0;  

// uint8_t to float (twice)
// float to double
// double to uint8_t
return (uint8_t)(((a * invertedByte) * (b * invertedByte)) * 255.0);
//                ^---- float product ------------------^    double

更好的 FP 解决方案将使用

const float invertedByte = 1.0f/255.0f;  
// unsigned to float (once)
// float to uint8_t
return (uint8_t)( ((unsigned)a * (unsigned)b) * invertedByte);

仍然是一个全整数解 - 类似于 @Jakub Dóka。

return (uint8_t) (((unsigned)a * (unsigned)b + 255u) >> 8);

或者按照@Paul Hankin

的建议

return (uint8_t) ((unsigned)a * (unsigned)b + 127u) / 255u;

另见@Ian Abbott好主意

return ((uint_fast32_t)a * (uint_fast32_t)b * 0x10101u + 0x800000u) >> 24;

经过一番搜索，我意识到，我可以将其升级为：

uint8_t multiplyBytes(uint8_t a,uint8_t b) {
    return (uint8_t)(((unsigned short)a * (unsigned short)b + 255) >> 8);
}

不确定这是否是最佳解决方案。

c raylib