问题描述
让我们考虑两列:visitor & id_user
某些 'visitor' 在 'id_user 上有缺失值,但其他值没有。
问题是“visitor”的相同唯一值出现在两种情况下:有“id_user”和丢失。
我想为出现相同“访问者”的情况填充值,并使用有时出现在该特定情况下的“id_user”值
我尝试了以下方法: 在“id_user”(full_user)上创建一个带有“visitor”的数据框,并且没有丢失 使用 'id_user' (missing_user) 上的 MISSINGS 创建一个带有 'visitor' 的数据框
我使用 zip 对它们进行迭代:
for i,j in zip(full_user['visitor'],missing_user['visitor']:
if i == j:
missing_user['id_user'] = full_user['id_user']
但是没有用。 谢谢!
解决方法
在压缩数据集时尝试使用字典。
dictionary = dict(zip(full_user['visitor'],missing_user['visitor'])
for i,j in dictionary :
if i == j:
missing_user['id_user'] = full_user['id_user']