在Linux内核内部支持浮点运算的开销

问题描述

|| 众所周知,基于Linux / BSD的内核不支持浮点(FP)算法。在内核中处理FP寄存器的开销是多少?     

解决方法

        通常的答案是,如果内核不使用浮点,则不必在进入内核时保存浮点寄存器,也不必在退出时恢复浮点寄存器。这样可以减少所有系统调用成本的数百个周期。 我不知道是否有人试图将这种节省与性能提高进行比较,如果内核可以不加选择地使用这些寄存器,那么性能提高可能是可用的。请注意,如果您采取适当的措施,则可以在内核中使用它们,并且这是在可获得巨大速度优势的情况下完成的,例如使用SSE指令加速
memcpy
等。 (在Linux资源中查找对ѭ1的调用。)