问题描述
我得到了这个数据框
print(tablaFrecuencias)
i=gramos 100 120 150 170 190 200
0 Manzanas 2000 1450 1000 550 0 0
1 Mango 0 250 750 2000 1000 0
2 Pera 0 0 0 350 650 1000
我必须获得每个像元的概率,所以我得到了一个新的像元
totalFrutas = pd.DataFrame(totalFrutas)
print(totalFrutas)
0
0 5000
1 4000
2 2000
现在我要像这样将第一个划分为第二个
2000/5000 1450/5000...
0/4000 250/4000...
0/2000 0/2000...
尝试这样做,但这给了我
probabilidadCardinalidad = tablaFrecuencias.div(totalFrutas,axis=0)
print(probabilidadCardinalidad)
0 100 120 150 170 190 200 i=gramos
0 NaN NaN NaN NaN NaN NaN NaN NaN
1 NaN NaN NaN NaN NaN NaN NaN NaN
2 NaN NaN NaN NaN NaN NaN NaN NaN
这是我的完整代码
tablaFrecuencias = pd.read_csv("BY.csv",header = 0)
totalFrutas = tablaFrecuencias.sum(axis=1)
print(totalFrutas)
totalFrutas1 = totalFrutas.sum(axis=0)
print(totalFrutas1)
probabilidadFruta = totalFrutas.div(totalFrutas1)
totalFrutas = pd.DataFrame(totalFrutas)
print(totalFrutas)
x = tablaFrecuencias.select_dtypes('int').columns.tolist()
tablaFrecuencias[x] =
tablaFrecuencias.select_dtypes('int').div(totalFrutas.values)
print(tablaFrecuencias)
解决方法
首先使用df.select_dtypes
仅选择int
列。然后使用df.div
除以index
:
In [96]: x = tablaFrecuencias.select_dtypes('int').columns.tolist()
In [98]: tablaFrecuencias[x] = tablaFrecuencias.select_dtypes('int').div(totalFrutas.values)
In [99]: tablaFrecuencias
Out[99]:
i=gramos 100 120 150 170 190 200
0 Manzanas 0.4 0.2900 0.2000 0.110 0.000 0.0
1 Mango 0.0 0.0625 0.1875 0.500 0.250 0.0
2 Pera 0.0 0.0000 0.0000 0.175 0.325 0.5