c# – 如何使用HTML Agility Pack编辑HTML代码段

所以我有一个 HTML代码段,我想使用C#修改.
<div>
This is a specialSearchWord that I want to link to
<img src="anImage.jpg" />
<a href="foo.htm">A hyperlink</a>
Some more text and that specialSearchWord again.
</div>

我想将其转换为:

<div>
This is a <a class="special" href="http://mysite.com/search/specialSearchWord">specialSearchWord</a> that I want to link to
<img src="anImage.jpg" />
<a href="foo.htm">A hyperlink</a>
Some more text and that <a class="special" href="http://mysite.com/search/specialSearchWord">specialSearchWord</a> again.
</div>

我将根据这里的许多建议使用HTML敏捷包,但我不知道我要去哪里.尤其是,

>如何加载部分片段作为字符串,而不是一个完整的HTML文档?
>如何编辑?
>然后如何返回编辑对象的文本字符串?

解决方法

>与完整的HTML文档相同.没关系
> 2个选项:您可以直接编辑InnerHtml属性(或文本节点上的Text),或者使用例如修改dom树. AppendChild,PrependChild等
>您可以使用HtmlDocument.DocumentNode.OuterHtml属性或使用HtmlDocument.Save方法(个人我更喜欢第二个选项).

对于解析,我选择在div中包含搜索项的文本节点,然后使用string.Replace方法替换它:

var doc = new HtmlDocument();
doc.LoadHtml(html);
var textNodes = doc.DocumentNode.SelectNodes("/div/text()[contains(.,'specialSearchWord')]");
if (textNodes != null)
    foreach (HtmlTextNode node in textNodes)
        node.Text = node.Text.Replace("specialSearchWord","<a class='special' href='http://mysite.com/search/specialSearchWord'>specialSearchWord</a>");

并将结果保存为字符串:

string result = null;
using (StringWriter writer = new StringWriter())
{
    doc.Save(writer);
    result = writer.ToString();
}

相关文章

目录简介使用JS互操作使用ClipLazor库创建项目使用方法简单测...
目录简介快速入门安装 NuGet 包实体类User数据库类DbFactory...
本文实现一个简单的配置类,原理比较简单,适用于一些小型项...
C#中Description特性主要用于枚举和属性,方法比较简单,记录...
[TOC] # 原理简介 本文参考[C#/WPF/WinForm/程序实现软件开机...
目录简介获取 HTML 文档解析 HTML 文档测试补充:使用 CSS 选...