问题描述
我有如下所示的数据框,我想通过替换列的唯一值来使其不敏感。即,我想用“ faker”库生成的一些虚假姓氏代替姓氏列。
代码段如下。
import pandas as pd
from faker import Faker
fake = Faker()
print(fake.first_name())
print(fake.last_name())
last = ('Meyer','Maier','Meyer','Mayer','Meyr','Mair')
job = ('data analyst','programmer','computer scientist','data scientist','accountant','psychiatrist')
language = ('Python','Perl','Java','Cobol','Brainfuck')
df = pd.DataFrame(list(zip(last,job,language)),columns =['last','job','language'],index=first)
我想要的输出是使用假名称更改姓氏列,但是例如,应始终将Meyer替换为相同的假姓氏。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)