使用iloc，apply和带有df列的lambda作为条件的一部分

问题描述

import pandas as pd
import numpy as np

myData = {'Price': [30000,199,30000,199],'Length': [7,7,6]
          }

df = pd.DataFrame(myData,columns=['Price','Length'])

print(df)

df.iloc[:,np.r_[0]] = df.iloc[:,np.r_[0]].apply(lambda x: [y if y >= 30000 else round(y / 2,0) for y in x])

print(df)

它的作用是，从“价格”列中获取值，如果该值等于或大于30 000，则不更改该值，否则将其除以2并四舍五入为整数。这样做效果很好，但我确实遇到的问题是如何更改此代码，以按“ Length”列中的值将其除以???

我需要使用iloc，因为我不知道列的名称（它们可能会更改，但它们的位置不会改变），并且我想使用apply和lambda解决它。

另一个问题是如何使用相同的东西，但是例如，我想将两列分开（让“价格”和“年龄”除以“长度”列中的值）。

感谢您对此问题的帮助。

编辑：

基于jezrael的以下回答，我设法使用循环解决了第二个问题：

import pandas as pd

import numpy as np

myData = {'Price': [30000,'Age': [7,14,21,28,30000],7]
          }

df = pd.DataFrame(myData,'Age','Length'])

for column in df.columns[np.r_[0,1]]:
    df[column] = np.where(df[column] >= 30000,df[column],(df[column] / df.iloc[:,2]).round())
    print(df[column])

print(df)

我想知道如果不使用循环就可以做到吗？

解决方法

按条件使用numpy.where，此处不推荐使用apply，因为它很慢：

df.iloc[:,0] = np.where(df.iloc[:,0] >= 30000,df.iloc[:,0],(df.iloc[:,0] / df.iloc[:,1]).round())
print(df)
     Price  Length
0  30000.0       7
1     28.0       7
2  30000.0       7
3     28.0       7
4     33.0       6

编辑：

要使用多列，请使用DataFrame.iloc并将值用axis=0除以DataFrame.div：

df.iloc[:,[0,1]] = np.where(df.iloc[:,1]] >= 30000,1]],1]].div(df.iloc[:,2],axis=0).round())
print (df)
     Price      Age  Length
0  30000.0      1.0       7
1     28.0      2.0       7
2  30000.0      3.0       7
3     28.0      4.0       7
4     28.0  30000.0       7

一种方法是使用.loc和.iloc查找列小于30000的所有索引。使用此过滤器，将除法应用于所需数据

mask = df.loc[df.iloc[:,0] < 30000].index
df.iloc[mask,0] = (df.iloc[mask,0] / df.iloc[mask,1]).round()

#output
    Price   Length
0   30000.0 7
1   28.0    7
2   30000.0 7
3   28.0    7
4   33.0    6

apply conditional-statements lambda pandas