使用 accumulo 进行大量摄取

问题描述

使用 accumulo 1.7.4 和 cloudera HDFS 在 AWS 上进行海量数据摄取(多 TB 数据摄取)。

我没有看到大量的引用,但是利用更少的节点和更大的实例带宽和内存/cpu 和带有预拆分表的 HD 空间,或者更多的节点和更小的内存/cpu 是更好的速度吗?和更小的高清?

我最初使用 EBS 卷进行存储,发现使用本地 NVME 存储然后在操作完成时将数据快照到 EBS 更有利,所以我认为我没有触及任何 I/O 相关的边界......

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)