问题描述
背景
注意 np.copy 是浅拷贝,不会复制数组中的对象元素。 这对于包含 Python 对象的数组很重要。新数组将包含相同的对象,如果该对象可以修改(可变),这可能会导致意外:
基于 3.2 Memory layout,我认为数组 a
将指向包含 64 位浮点数的内存区域。
换句话说,数组主要是一块连续的内存块,其部分可以使用索引方案进行访问。
因为文档说np.copy is a shallow copy and will not copy object elements within arrays
,所以我认为内存区域不会被复制而是被引用。
但是,副本不是原始数组的视图,并且内存区域/地址不同,因为 x[0] = 10``` 之后 x[0] == z[0]
为 False。
x = np.array([1,2,3])
z = np.copy(x)
print(f"x.base {x.base} z.base {z.base}")
---
x.base None z.base None
x[0] = 10
print(x[0] == z[0])
---
False
print(f"x.base {x.base} z.base {z.base}")
---
x.base None z.base None
问题
np.copy(a)
到底在复制什么?
如果是shallow copy
,为什么要给z[0]
分配不同的内存区域?它实际上是复制数组 x
的对象,应该称为深度复制?还是写时复制?
或者shallow copy
的意思是“当np数组的一个元素是一个可变的容器,比如list,那么np.copy不会深度复制容器的内容”?
请帮助了解 z = np.copy(x)
的确切作用以及对 z
进行赋值操作时会发生什么。
解决方法
在python中,copy.copy()
方法执行shallow copy
,即只复制原始数据类型(例如int
、float
等)的对象,但构成对象(例如字典)不是,而是通过指针引用。
另一方面,copy.deepcopy()
方法将复制所有内容(包括复合数据结构,如字典),并生成与第一个相同的新对象。
在 numpy
模块的情况下,如果您将其用于数值计算(即计算数值 dtypes 之一的数据)copy
将等效于 { {1}}(因为 deepcopy
的所有 numeric 项都是原始 numpy
),并且会产生一个与第一个相同的新对象,您将其视为一个新对象正在为复制的项目分配数据空间。
干杯。