ReadLines 查找 Selector 然后从下一行获取数据

问题描述

我正在尝试从 PDF 获取一些数据,但遇到问题,因为重复标识符位于我需要的数据上方的行上,对于每个 PDF,索引可能因内容而异 在读取文件时,它已从 PDF 进行 OCR 转换为文本文件。所以从文本文件中读取。

我正在尝试获取货币;在这种情况下获得“EUR”
正在读取的数据:

货币费用总额
233.00 欧元

var currencyLine = File.ReadLines(extractData).Last(e => e.StartsWith("Currency Charge Totals"));
out_currency = (currencyLine.Substring(currencyLine.LastIndexOf(" ") + 1)).Trim();

此 PDF 中的“货币费用总计”以获取货币类型。 我知道目前这段代码不会在第二次返回任何值,我只是在做类似的事情来获取其他数据。

我只需要一些关于我需要更改的帮助以从“ReadLine”下方的行中获取详细信息

解决方法

如果你需要在你要找的那一行之后,你可以这样做:

File
.ReadLines(extractData)
.SkipWhile(e => !e.StartsWith("Currency Charge Totals"))
.Skip(1)
.FirstOrDefault();