问题描述
|
我正在使用Apple GCC 4.2.1,并且偶然发现了以下代码的奇怪问题...在尝试初始化__m128类成员变量时,我总是会遇到EXC_BAD_ACCESS异常。不幸的是,以下简化的代码可以在测试应用程序中使用,但是也许您仍然可以帮助我找到问题的根源?
我无法理解EXC_BAD_ACCESS异常背后的原因-__m128类型不是指针,并且所有其他MyClass成员均已初始化和访问而没有任何问题,没有堆栈/堆损坏的迹象,如果我使用局部变量并且没有任何异常,则一切正常MSVC下的问题...对齐有问题吗?
请帮忙!
class MyClass
{
public:
// lots of members
__m128 vect;
MyClass()
{
vect = _mm_setr_ps (0.f,0.f,10.0f); // Program received signal: “EXC_BAD_ACCESS”.
}
void iniialize()
{
__m128 localVector = _mm_setr_ps (0.f,10.0f); // No problems
vect = localVector; // Program received signal: “EXC_BAD_ACCESS”.
}
};
解决方法
从我的主意:我会说对齐问题
特别是说“很多会员”的部分
看
__attribute__
2
堆栈变量是否由GCC __attribute __((aligned(x)))对齐?
http://gcc.gnu.org/onlinedocs/gcc-4.1.2/gcc/Variable-Attributes.html#Variable-Attributes
, 如果在堆栈上创建对象,gcc会自动正确对齐__m128
个成员,但是对于通过new
分配的对象,您将受内存分配器的支配,在Linux上通常只有8字节对齐。您可能需要为类重写运算符new
,以便它调用posix_memalign,以便始终获得16字节对齐的对象。
话虽如此,如果您要进行SSE代码优化,那么您可能需要重新评估编码方式-由于性能通常是SIMD优化的动力,因此您可能希望工作在比C ++类更低的水平上-通常,您只想对大块连续数据(即1D或2D数组)进行均匀操作。
, 如果是堆栈未对准的问题,则应检查-mstackrealign
命令行选项,请参阅GCC文档。这解决了我关于MinGW目标的问题。另请参见有关堆栈对齐的讨论。最后,您可能需要将GCC更新到较新的版本。
另一方面,如果您动态分配对象,则必须确保内存对齐,如Paul所述。像_mm_malloc
和_mm_free
这样的方法可以帮助您。