Kotlin中的PDFBox-PDF文件的矩形字段的输出

问题描述

这是我第一次在这里发布消息,对不起,如果我做错了什么。 我的英语目前还不是最好的。

我是编码方面的新手,确实从YouTube上的一些有用的教程开始。

我的第一个项目应该从pdf文件获取一些数据。 我为此使用了PDFBox,它对我来说很好用。

我目前无法解决的唯一问题是:

提取的数据是pdf中的4个表,我使用了extractbyarea并设置了正确的整数(x,y,w,h)。 数据写在输出中,至此对我来说很好。

我得到了一个名为“ daten61”的字符串。但是如果我使用println(daten61)我得到了字符串 显示为换行符。我想像这样使用它:

09.08 3931 15:59 00:46

而不是:

09.08

3931

15:59

00:46

我尝试过修剪,更换,无论如何……它不会起作用。 还有其他解决方案吗? PDFBox内部有人可以帮助解决问题吗? 另外,我想使用[09.08,3931,15:59,00:46]这样的String来开始我的项目的下一步。

谢谢!

使用的代码

val document = File("C://test//test1.pdf")
val doc = PDDocument.load(document)
val stripper = PDFTextStripperByArea()
stripper.sortByPosition = true

val output = ""
val rect = Rectangle(x,y,w,h)
stripper.addRegion(output,rect)


val firstPage = doc.getPage(0)
stripper.extractRegions(firstPage)

return (stripper.getTextForRegion(output))

/ println(输出)ive获得4行数据后

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)