如何映射和计算 2 个数据帧中出现的项目

问题描述

我是数据科学的新手,我还在学习,所以如果我解释我的问题不正确,请原谅。

我有 2 个数据框,第一个数据框(项目)显示一些杂货产品名称,它是项目编号,而第二个数据框(交易)显示包含已购买项目的交易编号。

第一个数据帧(项目)=

项目 产品名称
100 奶酪
201 牛奶
302 鸡蛋

第二个数据帧(转换)

交易
201 100 302
100 302
201 302

我设法拆分交易列并通过此代码将其分开

Transaction=transactions.str.split(' ',expand=True)],axis=1) DataFrame 变得像

0 1 2
201 100 302
100 302
201 302

现在我正在努力研究如何映射两个数据框和一个热函数或 Get_dummies,并计算从 DataFrame (items) 购买/发生在 DataFrame(Transaction) 中的项目数。

我想这样做的原因是因为我试图这样做是为了应用 Apriori 函数来查找购物篮分析的关联规则。

提示。数据帧经过简化,实际数据帧长度为 10,000。

非常感谢您的帮助

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)