问题描述
我被指派编写一个应用程序,该应用程序可以进入目录、查找某种类型的文件、获取文件中的任何超链接并记录它们。到目前为止,一切都很顺利。但是,出于某种原因,我遇到了问题,只能获取文件中的两个链接之一。两个链接都指向同一个网址。它似乎忽略了前两个文件中的第二个,但第三个就好了。
string pathtofolder = "C:\\Users\\Icmolreulf\\source\\repos\\FileSearch\\FileSearch\\powershelltesting";
string[] files = System.IO.Directory.GetFiles(pathtofolder,"*.docx");
Console.WriteLine(files.Length);
for (int i = 0; i < files.Length; i++)
{
WordprocessingDocument word = WordprocessingDocument.Open(files[i],true);
IEnumerable<HyperlinkRelationship> link = from x in word.MainDocumentPart.HyperlinkRelationships where (x.RelationshipType == "http://schemas.openxmlformats.org/officeDocument/2006/relationships/hyperlink") select x;
foreach (HyperlinkRelationship l in link)
{
if (isValidURL(l.Uri.ToString()))
{
Console.WriteLine(l.Uri.ToString());
}
}
}
static bool isValidURL(string uriName)
{
Uri uriResult;
bool result = Uri.TryCreate(uriName,UriKind.Absolute,out uriResult)
&& (uriResult.Scheme == Uri.UriSchemeHttp || uriResult.Scheme == Uri.UriSchemeHttps);
return result;
}
我不知道问题可能是什么。我希望找到的所有文件的 url 都是相同的:http://burymewithmymoney.com/。我已经确保它在所有这些中。我还尝试将另一个 .docx 文件添加到目录中,它可以工作,但它也忽略了该文件。我真的很感激我能得到的任何帮助。
解决方法
问题出在我正在读取的文件上。代码工作正常。很抱歉占用您的时间。祝您度过愉快的一天。