如何使用openpyxl在Python中将一个Excel文件的列值与另一个Excel文件的列值进行比较?

问题描述

我能够读取两个Excel文件的列数据。下面是我的代码:-

from openpyxl import load_workbook

book = load_workbook("Book1.xlsx")
book2 = load_workbook("Book2.xlsx")

sheets = book['Sheet1']
anotherSheet = book2["sheet1"]

for val1 in sheets:
    print(val1[0].value)

print("\n\n\n\n")

for val2 in anotherSheet:
    print(val2[0].value)

我需要将Book1的列的每个值与Book2的列的每个值进行比较。我对如何进行比较感到困惑。如果值匹配,那么我可以添加另一列并输入“是”,如果不匹配,则可以输入“否”。换句话说,我只需要检查Book2的Book1的Column中是否存在值。一些帮助将不胜感激。

解决方法

我不知道完整的答案,但我想您可以对数组取值并一一比较它们

,

最后,找出解决方案。

首先,我们需要创建3个列表来存储book1,book2和tempList中的值以存储匹配的值。

from openpyxl import load_workbook

book = load_workbook("Book1.xlsx")
book2 = load_workbook("Book2.xlsx")

sheets = book['Sheet1']
anotherSheet = book2["sheet1"]
book1_list = []
book2_list = []
tempList = []

接下来,我们还想跳过列的标题并存储在新变量中。

skip_Head_of_anotherSheet = anotherSheet[2: anotherSheet.max_row]

然后遍历工作表,并将所需列的值附加到它们各自的列表中(在我的情况下为'0',这意味着第一列)。

for val1 in sheets:
    book1_list.append(val1[0].value)

for val2 in skip_Head_of_anotherSheet:
    book2_list.append(val2[0].value)

检查列表中的重复项,并删除所有重复的值。

book1_list = list(dict.fromkeys(book1_list))

存储列表的长度以进行调试

length_of_firstList = len(book1_list)
length_of_secondList = len(book2_list)

接下来,遍历两个列表并检查它们是否匹配,然后将匹配的值存储到tempList

for i in book1_list:
    for j in book2_list:
        if i == j:
           tempList.append(j)
           #print(j)

现在,该编辑我们的Excel工作表了。我们将迭代存储在tempList中的匹配值,并找到实际excel工作表中的那些值。当我们检测到相同的值时,我们将通过标识该特定行的索引,将YES标记到excel工作表的第4列,即“ D”列。此外,如果“ D”列中的单元格为空,则将标记NO

for temp in tempList:
    for pointValue in skip_Head_of_anotherSheet:
        if temp == pointValue[0].value:
            anotherSheet.cell(column=4,row=pointValue[0].row,value="YES")
            #print(pointValue[0].row)

        if pointValue[3].value is None:
            anotherSheet.cell(column=4,value="NO")

最后,我们将在新填充的列中添加标题,并保存我们的excel工作表并打印所需的信息以进行调试。

anotherSheet.cell(column=4,row=1,value="PII")
book2.save("Book2.xlsx")

print("SUCCESSFULLY UPDATED THE EXCEL SHEET")
print("Length of First List = ",length_of_firstList)
print("Length of Second List = ",length_of_secondList)

我希望这会对遇到同样问题的人有所帮助。