问题描述
我是数据科学的新手,我还在学习,所以如果我解释我的问题不正确,请原谅。
我有 2 个数据框,第一个数据框(项目)显示一些杂货产品名称,它是项目编号,而第二个数据框(交易)显示包含已购买项目的交易编号。
第一个数据帧(项目)=
项目 | 产品名称 |
---|---|
100 | 奶酪 |
201 | 牛奶 |
302 | 鸡蛋 |
第二个数据帧(转换)
交易 |
---|
201 100 302 |
100 302 |
201 302 |
我设法拆分交易列并通过此代码将其分开
Transaction=transactions.str.split(' ',expand=True)],axis=1)
DataFrame 变得像
0 | 1 | 2 |
---|---|---|
201 | 100 | 302 |
100 | 302 | 无 |
201 | 302 | 无 |
现在我正在努力研究如何映射两个数据框和一个热函数或 Get_dummies,并计算从 DataFrame (items) 购买/发生在 DataFrame(Transaction) 中的项目数。
我想这样做的原因是因为我试图这样做是为了应用 Apriori 函数来查找购物篮分析的关联规则。
提示。数据帧经过简化,实际数据帧长度为 10,000。
非常感谢您的帮助
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)