c# – 使纯文本URL可点击时的正则表达式字符串问题

我需要在C#中使用一个正常的 Regex代码来检测字符串中的纯文本URL(http / https / ftp / ftps),并通过在其周围放置一个带有相同url的锚标记来使它们可单击.我已经制作了一个Regex模式,代码附在下面.

但是,如果输入字符串中已存在任何可点击的URL,则上面的代码会在其上添加一个标记.例如,下面代码中的现有子字符串:string sContent:“ftp://www.abc.com’\u0026gt; ftp://www.abc.com”在运行下面的代码时,它上面有另一个标记.有没有办法解决它?

string sContent = "ttt <a href='ftp://www.abc.com'>ftp://www.abc.com</a> abc ftp://www.abc.com abbbbb http://www.abc2.com";

        Regex regx = new Regex("(http|https|ftp|ftps)://([\\w+?\\.\\w+])+([a-zA-Z0-9\\~\\!\\@\\#\\$\\%\\^\\&amp;\\*\\(\\)_\\-\\=\\+\\\\\\/\\?\\.\\:\\;\\'\\,]*)?",RegexOptions.IgnoreCase);

        MatchCollection mactches = regx.Matches(sContent);

        foreach (Match match in mactches)
        {
            sContent = sContent.Replace(match.Value,"<a href='" + match.Value + "'>" + match.Value + "</a>");
        }

此外,我想要一个正则表达式代码,使用“mailto”标签可以点击电子邮件.我可以自己做,但上面提到的双锚标签问题也会出现在其中.

解决方法

我在你的示例测试字符串中注意到,如果重复链接,例如ftp://www.abc.com在字符串中并且已经链接,然后结果将双重锚定该链接.您已经拥有的正则表达式以及@stema提供的正则表达式将起作用,但您需要以不同方式处理如何替换sContent变量中的匹配项.

以下代码示例应该为您提供所需内容

string sContent = "ttt <a href='ftp://www.abc.com'>ftp://www.abc.com</a> abc ftp://www.abc.com abbbbb http://www.abc2.com";

Regex regx = new Regex("(?<!(?:href='|<a[^>]*>))(http|https|ftp|ftps)://([\\w+?\\.\\w+])+([a-zA-Z0-9\\~\\!\\@\\#\\$\\%\\^\\&amp;\\*\\(\\)_\\-\\=\\+\\\\\\/\\?\\.\\:\\;\\'\\,RegexOptions.IgnoreCase);

MatchCollection matches = regx.Matches(sContent);

for (int i = matches.Count - 1; i >= 0 ; i--)
{
    string newURL = "<a href='" + matches[i].Value + "'>" + matches[i].Value + "</a>";

   sContent = sContent.Remove(matches[i].Index,matches[i].Length).Insert(matches[i].Index,newURL);
}

相关文章

在要实现单例模式的类当中添加如下代码:实例化的时候:frmC...
1、如果制作圆角窗体,窗体先继承DOTNETBAR的:public parti...
根据网上资料,自己很粗略的实现了一个winform搜索提示,但是...
近期在做DSOFramer这个控件,打算自己弄一个自定义控件来封装...
今天玩了一把WMI,查询了一下电脑的硬件信息,感觉很多代码都...
最近在研究WinWordControl这个控件,因为上级要求在系统里,...