问题描述
|
我正在使用Alfresco ECM,通过Tiger OCR库将TIFF转换为PDF()
我的自定义转换xml(ocr-transformers-context)是
<?xml version=\'1.0\' encoding=\'UTF-8\'?>
<!DOCTYPE beans PUBLIC \'-//SPRING//DTD BEAN//EN\' \'http://www.springframework.org/dtd/spring-beans.dtd\'>
<beans>
<bean id=\"transformer.Ocr.Tiff2Pdf\" class=\"org.alfresco.repo.content.transform.RuntimeExecutableContentTransformerWorker\">
<property name=\"checkCommand\">
<bean class=\"org.alfresco.util.exec.RuntimeExec\">
<property name=\"commandsAndArguments\">
<map>
<entry key=\".*\">
<list>
<value>c:\\ocr\\ocr.exe</value>
<value>--about</value>
</list>
</entry>
</map>
</property>
</bean>
</property>
<property name=\"transformCommand\">
<bean class=\"org.alfresco.util.exec.RuntimeExec\">
<property name=\"commandsAndArguments\">
<map>
<entry key=\"Windows.*\">
<list>
<value>c:\\ocr\\ocr.exe</value>
<value>--replace</value>
<value>--replace</value>
<value>--language en</value>
<value>--pdf</value>
<value>--output-file</value>
<value>${target}</value>
<value>${source}</value>
</list>
</entry>
</map>
</property>
</bean>
</property>
<property name=\"explicitTransformations\">
<list>
<bean class=\"org.alfresco.repo.content.transform.ExplictTransformationDetails\" >
<property name=\"sourceMimetype\"><value>image/tiff</value></property>
<property name=\"targetMimetype\"><value>application/pdf</value></property>
</bean>
<bean class=\"org.alfresco.repo.content.transform.ExplictTransformationDetails\" >
<property name=\"sourceMimetype\"><value>image/tiff</value></property>
<property name=\"targetMimetype\"><value>text/plain</value></property>
</bean>
</list>
</property>
</bean>
</beans>
现在,当我将TIFF文件导入到Company Home文件夹中时,我希望将其内容转换为PDF。现在,我是否可以假定转换是自动的,是否正确?是否需要在空间上调用规则?
另外,我将转换的日志记录设置为DEBUG,这就是我在Alfresco日志中看到的内容
调试[util.exec.RuntimeExec]
执行结果:os:
Windows XP命令:
[c:\\ ocr \\ ocr.exe,-about]
成功:正确的退出代码:0
out:智能OCR命令行
实用程序,版本1.1.0。版权所有©
2006年。
学分:
TIFF库版权(c)
1988-1997 Sam Leffler版权所有(c)
1991年至1997年Silicon Graphics,Inc.
独立的JPEG组库
版权(C)1991-19
用户:admin DEBUG
[content.transform.ContentTransformerRegistry]
搜索变压器:源
模仿类型:图像/ tiff目标
模仿类型:文本/纯文本变形金刚:
[]
当我确实需要将文本/纯文本转换为PDF时,似乎在搜索它。我在这里想念什么?请帮助
解决方法
唯一会自动运行的转换是纯文本转换,用于全文索引。
如果您使用的是共享,则共享将尝试为您进行另外两个转换。首先,当您查看其中包含文件的文件夹时,它将尝试(通过再现服务)生成缩略图。为此,通常需要从新的mime类型到image / jpeg定义一个转换器。此外,当您在“共享”中查看文档详细信息时,它将尝试为您提供网络预览。
如果您希望在上传文档时生成PDF版本的文档,则需要定义一个规则。您可以使用转换内容规则来执行此操作,或者,如果您想对其进行大量控制,则可以编写脚本来使用“渲染服务”。