问题描述
这是我第一次在这里发布消息,对不起,如果我做错了什么。 我的英语目前还不是最好的。
我是编码方面的新手,确实从YouTube上的一些有用的教程开始。
我的第一个项目应该从pdf文件中获取一些数据。 我为此使用了PDFBox,它对我来说很好用。
我目前无法解决的唯一问题是:
提取的数据是pdf中的4个表,我使用了extractbyarea并设置了正确的整数(x,y,w,h)。 数据写在输出中,至此对我来说很好。
我得到了一个名为“ daten61”的字符串。但是如果我使用println(daten61)我得到了字符串 显示为换行符。我想像这样使用它:
09.08 3931 15:59 00:46
而不是:
09.08
3931
15:59
00:46
我尝试过修剪,更换,无论如何……它不会起作用。 还有其他解决方案吗? PDFBox内部有人可以帮助解决问题吗? 另外,我想使用[09.08,3931,15:59,00:46]这样的String来开始我的项目的下一步。
谢谢!
使用的代码
val document = File("C://test//test1.pdf")
val doc = PDDocument.load(document)
val stripper = PDFTextStripperByArea()
stripper.sortByPosition = true
val output = ""
val rect = Rectangle(x,y,w,h)
stripper.addRegion(output,rect)
val firstPage = doc.getPage(0)
stripper.extractRegions(firstPage)
return (stripper.getTextForRegion(output))
/ println(输出)ive获得4行数据后
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)