c# – 用于转换超链接的RegExp帮助

我试图想出一个正则表达式并尝试了许多组合并搜索以找到将非超链接地址转换为超链接解决方案.

http://twitpic.com/abcdef http://www.smh.com.au askjhsd www.hotmail.com ks sd 
<a href="http://www.aaaaaaaa.com">aaaaaaaa</a>

我想要http://twitpic.com/abcdef,http://www.smh.com.au和www.hotmail.com,但不是http://www.aaaaaaaa.com,因为它被包装围绕< a>标签已经.

我目前在C#中使用此正则表达式

return Regex.Replace(input,@"(\b((http|https)://|www\.)[^ ]+\b)",@" <a href=""$0"" target=""_blank"">$0</a>",RegexOptions.IgnoreCase);

我不知道如何排除已包含在< a>中的内容或者< img>

救命 :)

编辑

对于那些稍后阅读的人来说,这是我提出的最终解决方

/// <summary>
/// Adds to the input string a target=_blank in the hyperlinks
/// </summary>
public static string ConvertURLsToHyperlinks(string input)
{
    if (!string.IsNullOrEmpty(input))
    {
        var reg = new Regex(@"(?<!<\s*(?:a|img)\b[^<]*)(\b((http|https)://|www\.)[^ ]+\b)");
        return reg.Replace(input,new MatchEvaluator(ConvertUrlsMatchDelegate));

    }
    return input;
}

public static string ConvertUrlsMatchDelegate(Match m)
{
    // add in additional http:// in front of the www. for the hyperlinks
    var additional = "";
    if (m.Value.StartsWith("www."))
    {
        additional = "http://";
    }
    return "<a href=\"" + additional + m.Value + "\" target=\"_blank\">" + m.Value + "</a>";
}

解决方法

你可以用

@"(?<!<\s*(?:a|img)\b[^<]*)(\b((http|https)://|www\.)[^ ]+\b)"

作为你的正则表达式. negative lookbehind assertion.

后视断言解释说:

(?<!       # Assert that it's impossible to match before the current position:...
 <         # a <
 \s*       # optional whitespace
 (?:a|img) # a or img
 \b        # as an entire word
 [^<]*     # followed by any number of characters except <
)          # end of lookbehind

相关文章

目录简介使用JS互操作使用ClipLazor库创建项目使用方法简单测...
目录简介快速入门安装 NuGet 包实体类User数据库类DbFactory...
本文实现一个简单的配置类,原理比较简单,适用于一些小型项...
C#中Description特性主要用于枚举和属性,方法比较简单,记录...
[TOC] # 原理简介 本文参考[C#/WPF/WinForm/程序实现软件开机...
目录简介获取 HTML 文档解析 HTML 文档测试补充:使用 CSS 选...