问题描述
我对 Hbase 还很陌生,目前正在研究从 Hbase 2.0.2.3.1.4.0-315 加载数据的 Java 11 应用程序 我正在加载的表有一个数值作为 rowKey 和一个列“createdAt”,其中包含一个带有时间戳的字符串。
尽管我很在意,这张桌子看起来像这样:
rowKey | createdAt | 名称 |
---|
我从以前的一位开发人员那里继承了剪辑,像这样加载数据,但在他们的情况下,rowKey 与 createdAt 列相同,在我的情况下不是。 他们用
config.set(TableInputFormat.SCAN_ROW_START,rowKeyFrom);
config.set(TableInputFormat.SCAN_ROW_STOP,rowKeyTo);
其中 config
是 org.apache.hadoop.conf.Configuration
,来自 hadoop-common-3.1.1.3.1.4.0-315 工作正常。
据我所知,他们所做的是“加载 rowKey 介于 rowKeyFrom
和 rowKeyTo
之间的数据,但我想要“加载 createdAt 的数据” 介于 rowKeyFrom
和 rowKeyTo
之间。
我不知道该怎么做,我无法以任何方式更改 hbase 表或依赖项(公司规则)。
更新: 基本上问题是“我如何使用另一列作为 rowKey 而不必扫描所有内容?”
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)