问题描述
我有一个数据集,如下所示。我如何使用PIG在左栏中计算重复值的次数,以得到如下所示的输出。我尝试使用COUNT()函数失败。
输入:
(h,2007)
(h,2008)
(h,2009)
(n,2009)
(b,2005)
(b,2006)
(b,2007)
(b,2008)
(b,2009)
(d,2007)
(d,2005)
(d,2006)
输出:
(h,3)
(n,1)
(b,5)
(d,3)
非常感谢您的帮助
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)