python-匹配第一个字母数字字符的跳过(| An?)

我有一个艺术家,专辑和曲目的列表,我想使用它们各自名称的首字母进行排序.当我想忽略“ The”,“ A”,“ An”和其他各种非字母数字字符时(与您交谈“ Weird Al” Yankovic和[dialog]),问题就来了. Django有一个不错的开始’^(An?| The)’,但我想忽略这些以及其他一些我选择的东西.

我在Django中使用带有utf8_bin排序规则的MySQL数据库执行此操作.

编辑

好吧,我的错是没有提到这个,但是我正在访问的数据库只是准备好了.它是由Amarok创建和维护的,没有很多问题,我无法更改它.话虽如此,艺术家表中的The Chemical Brothers列为The Chemical Brothers,所以我想我留在这里了.这可能会很慢,但这对我来说不是什么大问题,因为它是一个个人项目.

最佳答案
您所要的可能不是您所需要的.您可能不想仅按首字母排序.如果第一个字母相同,则通常还需要查看第二个字母,依此类推.这将导致在按艺术家排序时,同一艺术家的所有歌曲都被分组在一起.

更新的答案

您说您不允许更改数据库.然后,您可以使用TRIM(LEADING ... FROM ...)去除不感兴趣的单词,但是请注意,这将很慢,因为查询将无法在列上使用索引.

SELECT *
FROM song
WHERE SUBSTRING(TRIM(LEADING 'The ' FROM TRIM(LEADING 'A ' FROM title)),1,1) = 'B'
ORDER BY TRIM(LEADING 'The ' FROM TRIM(LEADING 'A ' FROM title))

结果:

'The Bar'   -- "The" is ignored when sorting.
'Baz A'    

测试数据:

CREATE TABLE song (title NVARCHAR(100) NOT NULL);
INSERT INTO song (title) VALUES
('The Bar'),('Baz A'),('Foo'),('Qux'),('A Quux');

原始答案

另请注意,如果您对某列的函数进行ORDER BY,则当您有很多记录时,它将非常缓慢,因为该列的索引无法使用.相反,您应该存储另一列,在其中删除所有无用的单词(the,an等),并按该列排序.您可以在插入行时从应用程序将其插入该列,也可以在数据库中使用触发器.

相关文章

在正式开始之前,我们先来看下 MySQL 服务器的配置和版本号信...
> [合辑地址:MySQL全面瓦解](https://www.cnblogs.c...
物理服务机的CPU、内存、存储设备、连接数等资源有限,某个时...
1 回顾 上一节我们详细讲解了如何对数据库进行分区操作,包括...
navicat查看某个表的所有字段的详细信息 navicat设计表只能一...
文章浏览阅读4.3k次。转载请把头部出处链接和尾部二维码一起...