问题描述
我有一个搜索服务,可以将最近1分钟的查询频率写入Cassandra,如下所示。现在,我需要汇总最近1小时的频率,即计算最近1小时的每个查询的频率总和。
假定1小时窗口中的唯一查询数为500万。现在,我有三个聚合节点,它们从cassandra中读取,进行聚合并将其写回到另一个表中。
但是我不确定如何在聚合器节点之间分配工作负载,即如何协调工作?每条记录应仅由一个节点处理。如果是sql,也许我可以使用事务来自动读取数百条记录并将其标记为正在处理。但是我不知道如何在cassandra中实现这一目标。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)