正则表达式与有效IPv4地址的混淆

问题描述

我正在尝试编写一个Regex表达式,用于从包含许多有效,无效(两种)地址类型的文件中选择有效的IPv4地址。 我已经为此写了Regex,但是仍然打印出两个无效的IPv4地址-255.255.256.255和8.234.88,55 谁能帮助我了解为什么这两个我用我输入的正则表达式打印出来。

.LC0:
        .string "%d"
.LC1:
        .string "foo.baz == 1"
.LC2:
        .string "foo.baz != 1"
main:
        push    rbp
        mov     rbp,rsp
        sub     rsp,16
        lea     rax,[rbp-1]
        mov     rsi,rax
        mov     edi,OFFSET FLAT:.LC0
        mov     eax,0
        call    scanf
        movzx   eax,BYTE PTR [rbp-1]
        and     eax,1
        test    al,al
        je      .L2
        mov     edi,OFFSET FLAT:.LC1
        call    puts
        jmp     .L3
.L2:
        mov     edi,OFFSET FLAT:.LC2
        call    puts
.L3:
        mov     eax,0
        leave
        ret

我正在使用此正则表达式通过包含下面列出的IPv4地址的文件过滤有效的IPv4地址。

((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){1,3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)

我想知道为什么此正则表达式与255.255.256.255和8.234.88,55 IPv4地址匹配。

解决方法

为什么此正则表达式表达式与255.255.256.255和8.234.88,55 IPv4地址匹配。

不是。它匹配该字符串的一部分。您最有可能做到了:

Option Explicit
Sub dtToFormula()
    Dim R As Range,C As Range
    Dim vDateParts(2)
    
Set R = [a1:a10]
'Set R = ActiveCell 'or Selection whatever range you want to convert
For Each C In R
    If IsDate(C) And Not C.HasFormula Then
        vDateParts(0) = Year(C.Value2)
        vDateParts(1) = Month(C.Value2)
        vDateParts(2) = Day(C.Value2)
        C.Formula = "=DATE(" & Join(vDateParts,",") & ")"
    End If
Next C
    
End Sub

是的,它有效。但是模式与整体不匹配,它分别与部分$ echo '255.255.256.255' | grep -E '((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){1,3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)' 255.255.256.255 255.255.25匹配。 6.255仅允许第一部分匹配一次或两次,而不必匹配3次。喜欢:

{1,3}

由于 ((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.)((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.)(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?) 25 5 . 25 5 . 2 5 6.255 ^^^^^ - left over ,第一部分只能匹配一次。因为{1,3}将正则表达式应用于字符串的一部分,并且由于匹配了完整的正则表达式,所以将打印该行。

类似地,对于grep,部分8.234.88,55被匹配,而8.234.88不匹配。很酷的看到:

,55

要匹配整行,请执行$ echo '8.234.88,55' | grep --color -E '(((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){1,3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)){1}' 8.234.88,55 ^^^^^^^^ - is red 或添加锚点grep -x,或者您很可能要将^....$更改为{1,3},以精确匹配3个部分。

,

(((25 [0-5] | 2 [0-4] [0-9] | [01]?[0-9] [0-9]?)\\。)

我已经尝试过用C ++表示。 在此处解决逗号问题之前,在圆点之前添加一个额外的斜杠。

它解析了一个逗号,因为您缺少斜杠,因为它的编写方式将点解释为“解析除EOL之外的任何字符”。

同样,当您输入[01]时,表达式允许值以0开头吗?

有人建议如何处理该表达式:如果该表达式只有一位数字,怎么写?然后是2位数字,然后是3位数字...

(([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\\.){3}([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])
,

您的正则表达式未锚定在字符串的开头和结尾。它匹配每行的片段,而不是整个行的片段。

regex放在^$之间。

^匹配字符串的开头; $匹配字符串的结尾。

如果启用了多行匹配,则^匹配行的开头,$匹配行的结尾。

此外,regex稍有不正确,这使它的匹配程度低于应有的程度。 IPv4地址始终具有4个组成部分。由于{1,3},您的regex允许2到4个组件。结合缺乏锚点,它可以在您提到的行中找到两个匹配项。

看看regex101.com

regex应该是:

^((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)$