问题描述
在 C++ 中实现某些数据结构时,需要能够创建一个包含未初始化元素的数组。正因为如此,有
buffer = new T[capacity];
不合适,因为 new T[capacity]
初始化数组元素,这并不总是可行的(如果 T 没有默认构造函数)或期望的(因为构造对象可能需要时间)。典型的解决方案是分配内存并使用placement new。
为此,如果我们知道元素的数量是已知的(或者至少我们有一个上限)并在堆栈上分配,那么据我所知,可以使用对齐的字节或字符数组,然后使用 std::launder
访问成员。
alignas(T) std::byte buffer[capacity];
但是,它只解决了栈分配的问题,并没有解决堆分配的问题。为此,我假设需要使用对齐的新,并编写如下内容:
auto memory = ::operator new(sizeof(T) * capacity,std::align_val_t{alignof(T)});
然后将其转换为 std::byte*
或 unsigned char*
或 T*
。
// not sure what the right type for reinterpret cast should be
buffer = reinterpret_cast(memory);
但是,有几件事我不清楚。
- 如果 ptr 指向可与 T 进行指针互转换的对象,则结果
reinterpret_cast<T*>(ptr)
被定义。有关详细信息,请参阅 this answer 或 https://eel.is/c++draft/basic.types#basic.compound-3。我认为,将其转换为T*
是无效的,因为 T 不一定与 new 的结果是指针可互转换的。但是,对于char*
或std::byte
是否有明确定义? - 当将
new
的结果转换为有效的指针类型(假设它不是实现定义的)时,它是否被视为指向数组第一个元素的指针,或者只是指向单个对象的指针?虽然,据我所知,在实践中很少(如果有的话)很重要,但存在语义差异,仅当指向的元素是数组成员并且结果为pointer_type + integer
的算术指向另一个数组元素。 (见https://eel.is/c++draft/expr.add#4)。 - 就生命周期而言,数组
unsigned char
或std::byte
类型的对象可以为new (https://eel.is/c++draft/basic.memobj#intro.object-3) 的放置结果提供存储,但是它是否为其他类型的数组定义? - 据我所知,
T::operator new
和T::operator new[]
表达式在幕后调用::operator new
或::operator new[]
。既然内置new
的结果是 void,那么如何转换为正确的类型呢?这些是基于实现还是我们有明确定义的规则来处理这些? - 释放内存时,应该使用
::operator delete(static_cast<void*>(buffer),sizeof(T) * capacity,std::align_val_t{alignof(T)});
或者有其他方法吗?
PS:我可能会在实际代码中将标准库用于这些目的,但我试图了解幕后的工作原理。
谢谢。
解决方法
指针相互转换
关于指针相互转换,使用 T *
或 {[unsigned] char|std::byte} *
都没有关系。无论如何,您必须将其转换为 T *
才能使用它。
请注意,您必须调用 std::launder
(根据转换的结果)来访问指向的 T
对象。唯一的例外是创建对象的placement-new 调用,因为它们还不存在。手动析构函数调用不是例外。
如果您不使用 std::launder
,则缺少指针可相互转换只会是一个问题。
当将 new 的结果转换为有效的指针类型时(假设它不是实现定义的),它是否被视为指向数组第一个元素的指针,或者只是指向单个对象的指针?
如果您想更加安全,请在执行任何指针运算后将指针存储为 {[unsigned] char|std::byte} *
和 reinterpret_cast
。
类型为数组 unsigned char
或 std::byte
的对象可以为放置 new 的结果提供存储
该标准并没有说任何地方都需要“提供存储”才能让新安置工作发挥作用。我认为该术语的定义仅用于标准中其他术语的定义。
考虑[basic.life]/example-2
,其中operator=
使用placement-new 就地重建对象,即使类型T
不为相同类型T
“提供存储” .
既然内置 new 的结果是 void,那么如何转换为正确的类型?
不确定标准对此有何规定,但除了 reinterpret_cast
之外还有什么?
释放内存
你的方法看起来是正确的,但我think你没有传递大小。
,我认为您的前提可能不正确。如果 T 是一个类,则应调用默认构造函数。但是,这可能是空白的,如果您的类包含所有 POD(纯旧数据),则不会初始化任何内容。实际上,我一直都依赖于此,因为出于性能原因,我通常不希望初始化某些内容。
我相信对于全局数据等有一些警告,其中有些东西是零初始化的。但通常堆的东西不是。你可以测试它,你会发现内存中有一堆垃圾,至少在发布模式下编译时是这样。一些编译器会在调试模式下初始化内存,但这是在构造函数之外完成的。
例如,您可以在自定义放置新函数中设置数据,如果它是 POD,它仍将存在于构造函数中。有些人会说这是 UB,但我认为标准对 POD 说“什么也没做”,这意味着没有初始化。