如何从字符串的开头开始使用正则表达式

这是我遇到的一个古怪的问题(可能以前见过但从未注意过).

这是代码的要点:

my $url = 'http://twitter.com/' . $handle;
my $page = get($url);

if($page =~ m/Web<\/span>\s*<a href=\"(.+?)\"/gi) {
    $website = $1;
}

if($page =~ m/follower_count\" class=\"stats_count numeric\">(.+?)\s*</g) {
    $num_followers = $1;
}

它获得了一个Twitter网址,并使用一些正则表达式来捕获关注者和用户的网站.这段代码实际上运行正常.但是当您在搜索关注者之后切换订单并搜索网站时,网站会显示空白.事实证明,当你正则表达一个字符串时,似乎有点保存最后一个匹配的位置.在html中,网站显示后会显示关注者数量.如果您首先执行跟随者计数正则表达式,就像它启动网站正则表达式,其中跟随者计数停止(如对字符串的索引引用).

令我感到困惑的是,我最后有“g”运算符,表示“全局”,如“从全局搜索字符串……”.

在这里错过了什么吗?我似乎无法弄清楚为什么它恢复字符串上的最后一个正则表达式位置(如果这是有道理的).

解决方法

标量上下文中的/ g修饰符不会按照您的想法执行.摆脱它.

正如perlretut所解释的那样,标量上下文中的/ g依次循环每个匹配.它设计用于循环,如下所示:

while ($str =~ /pattern/g) {
    # match on each occurence of 'pattern' in $str in turn
}

使用/ g的另一种方法是在列表上下文中:

my @results = $str =~ /pattern/g; # collect each occurence of 'pattern' within $str into @results

如果你在标量上下文中使用/ g并且你没有迭代它,你几乎肯定没有正确使用它.

相关文章

正则替换html代码中img标签的src值在开发富文本信息在移动端...
正则表达式
AWK是一种处理文本文件的语言,是一个强大的文件分析工具。它...
正则表达式是特殊的字符序列,利用事先定义好的特定字符以及...
Python界一名小学生,热心分享编程学习。
收集整理每周优质开发者内容,包括、、等方面。每周五定期发...