如果列A相同,openpyxl如何突出显示所有其他不同的列?

问题描述

我有一个包含多列的Excel文件。第一列包含密钥,并且有重复项。

我想要实现的是比较包含相同键的所有列中的值,并突出显示它们是否不同。

下面是一个示例:

values = {'product_key': [101,102,103,101,105,103],'date': ['2020-01-01','2020-05-05','2019-11-15','2020-03-02','2019-03-01','2019-11-15'],'price': ['$15','$13','$11','$14',' $20','$18']}
df = pd.DataFrame(values,columns = ['product_key','date','price'])

我的桌子看起来像这样:

   product_key  date      price
      101    2020-01-01   $15
      102    2020-05-05   $13
      103    2019-11-15   $11
      101    2020-03-02   $14
      105    2019-03-01   $20
      103    2019-11-15   $18

我想突出显示101的两个价格和日期,并突出显示103的价格。我目前正在使用openpyxl。如果openpyxl无法做到这一点,那么还有其他库(anaconda中可用)可以帮助您吗?

解决方法

我并没有尝试仅使用openpyxl来实现这一目标,但这需要您遍历整个工作表(= dataframe)并按每个product_key进行手动分组,然后使用{{1} } /“ Excel”语法。

使用styleframe(我是其中的维护者之一)将允许您使用pandas语法在数据帧级别解决此问题。

首先,我们将openpyxl分组,然后使用product_key在每个子数据帧上调用自定义函数。然后我们可以将.apply与否定符(duplicated)一起使用,并使用~进行样式设置。

styleframe

会产生

enter image description here