C# OpenXML:仅在除最后一个之外的所有文件中获取文件中的第一个超链接

问题描述

我被指派编写一个应用程序,该应用程序可以进入目录、查找某种类型的文件获取文件中的任何超链接并记录它们。到目前为止,一切都很顺利。但是,出于某种原因,我遇到了问题,只能获取文件中的两个链接之一。两个链接都指向同一个网址。它似乎忽略了前两个文件中的第二个,但第三个就好了。

        string pathtofolder = "C:\\Users\\Icmolreulf\\source\\repos\\FileSearch\\FileSearch\\powershelltesting";

        string[] files = System.IO.Directory.GetFiles(pathtofolder,"*.docx");
        Console.WriteLine(files.Length);

        for (int i = 0; i < files.Length; i++)
        {
            WordprocessingDocument word = WordprocessingDocument.Open(files[i],true);
            IEnumerable<HyperlinkRelationship>  link = from x in word.MainDocumentPart.HyperlinkRelationships where (x.RelationshipType == "http://schemas.openxmlformats.org/officeDocument/2006/relationships/hyperlink") select x;
            foreach (HyperlinkRelationship l in link)
            {
                if (isValidURL(l.Uri.ToString()))
                {
                    Console.WriteLine(l.Uri.ToString());
                }
            }
        }
    static bool isValidURL(string uriName)
    {
        Uri uriResult;
        bool result = Uri.TryCreate(uriName,UriKind.Absolute,out uriResult)
            && (uriResult.Scheme == Uri.UriSchemeHttp || uriResult.Scheme == Uri.UriSchemeHttps);

        return result;
    }

我不知道问题可能是什么。我希望找到的所有文件的 url 都是相同的:http://burymewithmymoney.com/。我已经确保它在所有这些中。我还尝试将另一个 .docx 文件添加到目录中,它可以工作,但它也忽略了该文件。我真的很感激我能得到的任何帮助。

解决方法

问题出在我正在读取的文件上。代码工作正常。很抱歉占用您的时间。祝您度过愉快的一天。