如何正确使用regex正确识别python中的Internet中继聊天程序中从客户端到服务器的命令

问题描述

所以我在措辞上有些麻烦,但是从本质上讲,我正在开发一个客户端应用程序,该命令向IRC聊天服务器提供可提供某些功能的命令。有人建议我们使用正则表达式来解析此类命令。服务器接受客户端时,需要完成的第一个命令是USER命令,该命令通常如下所示: “用户来宾0 *:罗尼·里根”

部分是USER,后面是1个单词的用户名,我相信可以包含数字,模式是0-9的数字值,表示您当前的聊天模式,星号只是多余的东西,但它必须在那儿,最后一部分是冒号,实名前没有空格。就像注释中所述,手册并没有说真实名称必须是两个单独的名称,只是它可以包含空格,因此即使它很奇怪,它也可以是字母和空格的任意组合。

这是我根据对正则表达式的了解而想到的,但是在测试它时遇到了一些问题。 "USER\s[a-zA-Z0-9]\s\d\s*\s:[a-zA-z\s]"

这是我用来浏览的简单程序,它基于我浏览过的一些简单教程

import re

userPattern = re.compile("USER\s[a-zA-Z0-9]\s\d\s*\s:[a-zA-z\s]")


while True:
    regexTest = input()
    isMatch = userPattern.match(regexTest)

    if bool(isMatch) == True:
        print("valid request")
    else:
        print("invalid request")

无论如何,我总是收到一个无效的请求,并且我也尝试了其他几种方法。我无法确定是否是因为我的正则表达式或测试它的方法有问题。

解决方法

正则表达式中存在一些问题:

  1. [a-zA-Z0-9]代表一个字符,您需要在其末尾加号,以便它与1个或多个字符匹配:[a-zA-Z0-9]+[a-zA-z\s]也是如此。
  2. 正则表达式中的
  3. *是一个特殊符号,如果要与星号匹配,则需要对其进行转义:\*

因此,这是应该工作的正则表达式的固定版本: USER\s[a-zA-Z0-9]+\s\d\s\*\s:[a-zA-z\s]+

但是我认为可以简化一下:

  1. 如果您不关心冒号后面的内容,则可以在其中使用.+
  2. 您只能使用[a-zA-Z0-9](单词匹配器)来代替\w

所以我认为这也可以: USER\s\w+\s\d\s\*\s:.+