Cassandra表结构用于查询以获取所有用户名

问题描述

在我的cassandra数据库中,我有一个包含用户的表,并且我想要一个函数来按用户的唯一用户名搜索用户。为此,我需要从用户表中查询所有用户名,以便可以在服务器端对其进行过滤,因为对于“ nark”的输入,我还应该找到用户名“ Mark”,“ Narkis”等,因此我不能只使用用户名作为分区键,然后搜索确切的值。

如果将它们全部放在同一分区中,则会导致分区过热。如果将它们分布在多个分区上,则必须在所有分区中进行搜索

如何有效地为数百万个用户查询?有没有一种方法可以这样查询而不查询所有用户名

谢谢您的帮助!

解决方法

Cassandra本身并不适合这种用例。即使是二级索引的广泛使用,在这里也几乎没有什么帮助。

尽管如此,如果您已经在C *上拥有了所有数据来实现这种功能,那么您本质上就需要一个索引框架,最广泛使用的是Apache SOLR(基于Lucene构建)。在C *上进行模糊搜索,尽管用例中没有类似Elasticsearch这样的东西。