如果列A相同，openpyxl如何突出显示所有其他不同的列？

问题描述

我有一个包含多列的Excel文件。第一列包含密钥，并且有重复项。

我想要实现的是比较包含相同键的所有列中的值，并突出显示它们是否不同。

下面是一个示例：

values = {'product_key': [101,102,103,101,105,103],'date': ['2020-01-01','2020-05-05','2019-11-15','2020-03-02','2019-03-01','2019-11-15'],'price': ['$15','$13','$11','$14',' $20','$18']}
df = pd.DataFrame(values,columns = ['product_key','date','price'])

我的桌子看起来像这样：

   product_key  date      price
      101    2020-01-01   $15
      102    2020-05-05   $13
      103    2019-11-15   $11
      101    2020-03-02   $14
      105    2019-03-01   $20
      103    2019-11-15   $18

我想突出显示101的两个价格和日期，并突出显示103的价格。我目前正在使用openpyxl。如果openpyxl无法做到这一点，那么还有其他库（anaconda中可用）可以帮助您吗？

解决方法

我并没有尝试仅使用openpyxl来实现这一目标，但这需要您遍历整个工作表（= dataframe）并按每个product_key进行手动分组，然后使用{{1} } /“ Excel”语法。

使用styleframe（我是其中的维护者之一）将允许您使用pandas语法在数据帧级别解决此问题。

首先，我们将openpyxl分组，然后使用product_key在每个子数据帧上调用自定义函数。然后我们可以将.apply与否定符（duplicated）一起使用，并使用~进行样式设置。

styleframe

会产生

openpyxl python