问题描述
我在excel文件中有数据,我需要一种方法来识别是否存在某些相同的行。 我的数据构成了1000多个行,我想突出显示excel文档中的相同行。
这是我用来识别相同行的代码:
file = pd.read_excel('Path'.xlsx)
for i in range(1112):
for y in range(1113):
if file.iloc[i].equals(file.iloc[y]) & (i != y) & (i<y) :
print(file.iloc[i])
print(file.iloc[y])
file.to_excel(r'Path2',index = False)
问题是我还需要突出显示相同的行,而我没有设法做到这一点。
这是我在网上找到的一个小示例,我尝试更改某些部分以使脚本适应我的需要。它不起作用,但是我不知道如何解决它:
import pandas as pd
def highlight_max(x):
for i in range(3):
for y in range(4):
if ((x.iloc[i]) == (x.iloc[y])) & (i != y) & (i<y) :
return ['background-color: yellow' if x.iloc[i] == x.iloc[y] else '' for a in x]
cars = {'Brand': ['Honda Civic','Toyota Corolla','Ford Focus','Audi A4','Toyota Corolla'],'Price': [22000,25000,27000,35000,25000],'Year': [2000,2003,2005,2007,2003]}
df = pd.DataFrame(cars,columns = ['Brand','Price','Year'])
df.style.apply(highlight_max)
file.to_excel(r'path',index = False)
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)