问题描述
使用 accumulo 1.7.4 和 cloudera HDFS 在 AWS 上进行海量数据摄取(多 TB 数据摄取)。
我没有看到大量的引用,但是利用更少的节点和更大的实例带宽和内存/cpu 和带有预拆分表的 HD 空间,或者更多的节点和更小的内存/cpu 是更好的速度吗?和更小的高清?
我最初使用 EBS 卷进行存储,发现使用本地 NVME 存储然后在操作完成时将数据快照到 EBS 更有利,所以我认为我没有触及任何 I/O 相关的边界......
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)