使用 accumulo 进行大量摄取

使用 accumulo 1.7.4 和 cloudera HDFS 在 AWS 上进行海量数据摄取（多 TB 数据摄取）。

我没有看到大量的引用，但是利用更少的节点和更大的实例带宽和内存/cpu 和带有预拆分表的 HD 空间，或者更多的节点和更小的内存/cpu 是更好的速度吗？和更小的高清？

我最初使用 EBS 卷进行存储，发现使用本地 NVME 存储然后在操作完成时将数据快照到 EBS 更有利，所以我认为我没有触及任何 I/O 相关的边界......

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）