什么是Ruby on Rails的一个很好的PDF到HTML转换器?

我正在尝试将程序化PDF转换为 HTML.到目前为止,我一直在使用 pdftohtml,但我们的用户对结果不满意.

这就是我需要的:

>我在使用Ruby on Rails,但在Unix上工作的任何工具都可以正常工作,因为我可以从命令行调用它.但当然,一个好的宝石或插件将是完美的.
>我更喜欢它是开源的
>它需要能够处理图像
>如果有需要的话可以放弃图像,这将是很好的
>需要稳定
>它需要返回html的布局靠近原来的pdf(我试过pdftohtml,结果不是很好的情况)

解决方法

这里有几个更多的替代pdftohtml / xpdf:

> Adob​​e有一个免费的在线PDF到HTML或文本conversion service.可能需要一两分钟才能将文档恢复,但我怀疑这个选项会给你最好的结果.
>有一个pdf-reader红宝石宝石,可以让您访问PDF文件的内部.这将涉及到您的一些开发/扩展,但您可以使用它来解析PDF文件生成漂亮的HTML.如果您知道用户提前转换的文件类型(例如,如果他们正在使用标准化表单),这可能比听起来更容易.
>如果您使用ghostscript(gem在这里找到)将PDF转换为另一种格式,您可能会有更多的选择.宝石可以从PDF文件生成图像(png,jpg等),但是您可能将最好的运气转换成PostScript文件,因为似乎有一个十亿“PostScript到[insert format here]”转换器.

相关文章

validates:conclusion,:presence=>true,:inclusion=>{...
一、redis集群搭建redis3.0以前,提供了Sentinel工具来监控各...
分享一下我老师大神的人工智能教程。零基础!通俗易懂!风趣...
上一篇博文 ruby传参之引用类型 里边定义了一个方法名 mo...
一编程与编程语言 什么是编程语言? 能够被计算机所识别的表...
Ruby类和对象Ruby是一种完美的面向对象编程语言。面向对象编...