问题描述
我正在尝试阅读印地语 PDF 的内容。我已使用 itext7 库阅读 PDF 文件。
它对英语 PDF 工作正常,并且还可以获取确切的字符,但是当我尝试使用任何印地语(本地)语言 PDF 时,值的格式不可读。
我正在获取文本的无法识别的格式
d d d daaaah h eeh h ee aaaa
这里是阅读PDF页面的示例代码。
val pdfReader = PdfReader("pdfPath")
PdfDocument(pdfReader).use { doc ->
pdfContent = PdfTextExtractor.getTextFromPage(doc.getPage(1))
}
pdfReader.close()
是否需要将语言参数传递给 itext7 库才能获得准确的内容?