问题描述
我正在使用 raylib 并且它使用 32 位 RGBA 颜色。我在 cheatsheet 中搜索,但找不到任何合适的例程。我想要做的是将两种颜色相乘,就好像它们是 opengl 中的 vec4
一样(每个通道的范围从 0 到 1)。我其实已经成功了
执行了乘法,但对于如此简单的事情来说,它涉及大量浮点运算的速度相当慢:
uint8_t multiplyBytes(uint8_t a,uint8_t b) {
const float invertedByte = 1/255.0;
return (uint8_t)(((a * invertedByte) * (b * invertedByte)) * 255.0);
}
我的问题是是否有更好的方法来做到这一点?或者我应该坚持这个解决方案?
解决方法
我实际上已经成功地执行了乘法,但是对于如此简单的事情,它涉及大量浮点运算的运算相当缓慢:
改进 FP 数学的一个步骤是避免使用 float
和 double
类型。
// double to float
const float invertedByte = 1/255.0;
// uint8_t to float (twice)
// float to double
// double to uint8_t
return (uint8_t)(((a * invertedByte) * (b * invertedByte)) * 255.0);
// ^---- float product ------------------^ double
更好的 FP 解决方案将使用
const float invertedByte = 1.0f/255.0f;
// unsigned to float (once)
// float to uint8_t
return (uint8_t)( ((unsigned)a * (unsigned)b) * invertedByte);
仍然是一个全整数解 - 类似于 @Jakub Dóka。
return (uint8_t) (((unsigned)a * (unsigned)b + 255u) >> 8);
或者按照@Paul Hankin
的建议return (uint8_t) ((unsigned)a * (unsigned)b + 127u) / 255u;
另见@Ian Abbott好主意
return ((uint_fast32_t)a * (uint_fast32_t)b * 0x10101u + 0x800000u) >> 24;
,
经过一番搜索,我意识到,我可以将其升级为:
uint8_t multiplyBytes(uint8_t a,uint8_t b) {
return (uint8_t)(((unsigned short)a * (unsigned short)b + 255) >> 8);
}
不确定这是否是最佳解决方案。