问题描述
我有 DataSet
个销售订单。
我想在这个数据集中找到频繁项集。
真不知道怎么实现。
在每个网页中,即使在 youtube 中也只有一个示例!!
我使用 groupby
来查找不同的 users
及其 item_id
,如下所示。
df = pd.read_csv('orders.csv')
df2 = df.groupby(['ID_Customer','ID_Item']).sum()
print(df2.head())
结果是:
ID_Order Amount_Gross_Order Quantity_item
ID_Customer ID_Item
466132
42545 1739614 29598889.0 1.0
75068 6633327 119266.0 1.0
80046 4909041 15000.0 1.0
81692 2282609 68807.0 2.0
我想将每个 item_id
设置为一列,以将 0
或 1
指定为 apriori 的可执行模式。
我尝试了一些解决方案,但通常会崩溃。
我怎样才能真正运行 apriori?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)