python:创建校验位函数

问题描述

我正在尝试创建校验位并将它们附加在原始 UPC 之后。这是sample data

因为有前导0,所以我必须先把数据读成字符串:
import pandas as pd upc = pd.read_csv("/Users/lee/Desktop/upc.csv",dtype = str)

以下是校验位算法的示例:
如果upc是003459409000
步骤 (1) 0 + 3*0 + 3 + 3*4 + 5 + 3*9 + 4 + 3*0 + 9 + 3*0 + 0 + 3*0 = 60
步骤 (2) 60 mod 10 = 0
步骤 (3) check digit = 0 (if it's not 0,then check digit = 10 - number in step 2)

基于算法,​​代码如下:

def add_check_digit(upc_str):  
upc_str = str(upc_str)
if len(upc_str) != 12: 
raise Exception("Invalid length")

odd_sum = 0
even_sum = 0 
for i,char in enumerate(upc_str): 
j = i+1 
if j % 2 == 0: 
even_sum += int(char) 
else:m 
odd_sum += int(char) 
total_sum = (even_sum * 3) + odd_sum 
mod = total_sum % 10 
check_digit = 10 - mod 
if check_digit == 10: 
check_digit = 0 
return upc_str + str(check_digit) 

如果我运行此代码,它会提供正确的校验位并将此结果附加到原始 UPC 的末尾。对于上面的例子,如果我输入:

add_check_digit('003459409000')

输出给出 13 位 UPC 0034594090000

现在我的问题是:

  1. 功能仅适用于单个 upc,即我必须复制/粘贴每个单个 upc 并获取校验位。如何创建适用于数据框中 UPS 列表的函数?每个结果都应返回一个 13 位 UPC,并在原始 UPC 之后附加校验位。

  2. UPC 被读取为字符串。如何将功能应用到 UPC?我想我应该以某种方式将字符串转换为数字。我真的是 Python 新手。

  3. 获得新 UPC 后,如何将结果保存在 csv 文件中?

非常感谢您的帮助。

解决方法

因为我没有 CSV 文件,所以为我设置了数据,下面的步骤与您的相同

   No  Price(Op)  Price(Cl)   id
0   1       1200        500  a01
2   2       1500        600  a03
1   3       1400        500  a02
3   4       1800        500  a04
4   5       1000        500  a05
5   6       1570        800  a06
6   7       1290        500  a07
7   8       1357        570  a08

数据设置

df = pd.read_csv("/Users/lee/Desktop/upc.csv",dtype = str)
import pandas as pd
df=pd.DataFrame({"upc_in_file":['003459409000','003459409001','003459409002']})

将上述函数应用到 upc 列(从文件中读取的那一列)

def add_check_digit(upc_str):  
    upc_str = str(upc_str)
    if len(upc_str) != 12: 
        raise Exception("Invalid length")

    odd_sum = 0
    even_sum = 0 
    for i,char in enumerate(upc_str): 
        j = i+1 
        if j % 2 == 0: 
            even_sum += int(char) 
        else:
            odd_sum += int(char) 
            total_sum = (even_sum * 3) + odd_sum 
            mod = total_sum % 10 
            check_digit = 10 - mod 
        if check_digit == 10: 
            check_digit = 0 
    return upc_str + str(check_digit) 

现在保存文件!

df['new_upc']=df['upc_in_file'].apply(add_check_digit)

这看起来像 enter image description here