OpenRefine速度困惑

问题描述

我对 OpenRefine 的速度很好奇。我有两个大约 5 MB 的项目,长度大约为 35,000-40,000 行。

此数据集正常工作:https://raw.githubusercontent.com/whanley/egypt-data/main/exp-manifests-rough(1).tsv

这个数据集运行缓慢:https://raw.githubusercontent.com/whanley/b-g/master/bslc-members/bslc-members-to-1900-tsv.tsv

我注意到刻面时速度很慢。例如,按计数对第二个数据集列“姓氏”进行分面非常慢。

我曾尝试增加内存等。令我困惑的是两个非常相似的项目之间的速度差异。任何见解或提示将不胜感激。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)