如何正确使用regex正确识别python中的Internet中继聊天程序中从客户端到服务器的命令

问题描述

所以我在措辞上有些麻烦，但是从本质上讲，我正在开发一个客户端应用程序，该命令向IRC聊天服务器提供可提供某些功能的命令。有人建议我们使用正则表达式来解析此类命令。服务器接受客户端时，需要完成的第一个命令是USER命令，该命令通常如下所示： “用户来宾0 *：罗尼·里根”

部分是USER，后面是1个单词的用户名，我相信可以包含数字，模式是0-9的数字值，表示您当前的聊天模式，星号只是多余的东西，但它必须在那儿，最后一部分是冒号，实名前没有空格。就像注释中所述，手册并没有说真实名称必须是两个单独的名称，只是它可以包含空格，因此即使它很奇怪，它也可以是字母和空格的任意组合。

这是我根据对正则表达式的了解而想到的，但是在测试它时遇到了一些问题。 "USER\s[a-zA-Z0-9]\s\d\s*\s:[a-zA-z\s]"

这是我用来浏览的简单程序，它基于我浏览过的一些简单教程

import re

userPattern = re.compile("USER\s[a-zA-Z0-9]\s\d\s*\s:[a-zA-z\s]")


while True:
    regexTest = input()
    isMatch = userPattern.match(regexTest)

    if bool(isMatch) == True:
        print("valid request")
    else:
        print("invalid request")

无论如何，我总是收到一个无效的请求，并且我也尝试了其他几种方法。我无法确定是否是因为我的正则表达式或测试它的方法有问题。

解决方法

正则表达式中存在一些问题：

[a-zA-Z0-9]代表一个字符，您需要在其末尾加号，以便它与1个或多个字符匹配：[a-zA-Z0-9]+。 [a-zA-z\s]也是如此。
*是一个特殊符号，如果要与星号匹配，则需要对其进行转义：\*

因此，这是应该工作的正则表达式的固定版本： USER\s[a-zA-Z0-9]+\s\d\s\*\s:[a-zA-z\s]+

但是我认为可以简化一下：

如果您不关心冒号后面的内容，则可以在其中使用.+
您只能使用[a-zA-Z0-9]（单词匹配器）来代替\w

所以我认为这也可以： USER\s\w+\s\d\s\*\s:.+

python regex verification