问题描述
我需要创建一个非常大的numpy
数组,该数组将容纳非负整数值。我预先知道最大的整数是什么,所以我想尝试使用最小的数据类型。到目前为止,我有以下内容:
>>> import numpy as np
>>> def minimal_type(max_val,types=[np.uint8,np.uint16,np.uint32,np.uint64]):
''' finds the minimal data type needed to correctly store the given max_val
returns None if none of the provided types are sufficient
'''
for t in types:
if max_val <= np.iinfo(t).max:
return t
return None
>>> print(minimal_type(42))
<class 'numpy.uint8'>
>>> print(minimal_type(255))
<class 'numpy.uint8'>
>>> print(minimal_type(256))
<class 'numpy.uint16'>
>>> print(minimal_type(4200000000))
<class 'numpy.uint32'>
>>>
是否有内置numpy
的方式来实现此功能?
解决方法
它是numpy.min_scalar_type
。文档中的示例:
>>> np.min_scalar_type(10)
dtype('uint8')
>>> np.min_scalar_type(-260)
dtype('int16')
>>> np.min_scalar_type(3.1)
dtype('float16')
>>> np.min_scalar_type(1e50)
dtype('float64')
>>> np.min_scalar_type(np.arange(4,dtype='f8'))
dtype('float64')
您可能对float的行为不感兴趣,但是无论如何我都会将其包含在其他遇到此问题的其他人中,尤其是因为使用float16和缺少float-> int降级可能令人惊讶。 / p>