我不明白为什么numpy.genfromtxt没有使用delimiter =“,”正确分割下面的字符串,而它适用于我的块中的大多数其他字符串.
chunk[12968] Out[143]: '2901869281,3279442095,2012-12-15T23:00:00.003Z,Sacramento,CA,R#3817874,United States,38.583,-121.498,11,8,6,5,1,2,3,4,9,130\n'
我期待一个形状的数组(110,),但得到以下
genfromtxt([chunk[12968]],delimiter=",",dtype=np.int64) Out[142]: array([2901869281,-1,-1],dtype=int64)
请注意,我使用itertools中的izip_longest以这种方式读取块的大* csv:
with open('events.csv','r') as: for chunk in izip_longest(*[f] *50000): ...
感谢帮助.