问题描述
我正在尝试打印城市公司的散点数据,但它仅适用于一个数据集,而不适用于其他数据集。
它们几乎完全相同。两者的例子:
好:
lan,lon,comp
44.353243,48.791494,S7 Airlines
44.354418,48.79181,Аэрофлот-Российские Авиалинии
不好:
lan,comp
30.35767,59.924862,Авиадух
30.345738,59.932526,Аэрофлот
这是命令
dataproceesed.plot(kind="scatter",x=0,y=1,alpha=1,s= 1,figsize=(16,9),c="r")
谢谢!
解决方法
@dm2 帮助它是由于不同的类型。就我而言,不仅是因为“NAN”。解决了这个:
listForDelete = []
for each in range(len(dataproceesed)):
if dataproceesed["lan"][each] == 'undefined' or dataproceesed["lan"][each] == "0":
listForDelete.append(each)
if dataproceesed["lon"][each] == 'undefined' or dataproceesed["lon"][each] == "0":
listForDelete.append(each)
dataproceesed = dataproceesed.drop(listForDelete)
dataproceesed.dropna(inplace=True)
dataproceesed["lon"] = dataproceesed["lon"].astype('float64')
dataproceesed["lan"] = dataproceesed["lan"].astype('float64')
dataproceesed.info()