linux – 通过命令行将doc转换为txt

我们正在搜索允许我们将doc或docx文档转换为txt文件的程序.我们正在使用 linux,我们希望启动一个转换用户上传的doc文件的网站.我们不想使用开放式办公室/自由办公室因为我们有不好的经验. Pandoc无法处理doc文件:/

有人有想法吗?

解决方法

您必须使用两种不同的命令行工具,具体取决于您是使用.doc还是.docx格式.

对于.doc使用catdoc:

catdoc foo.doc > foo.txt

对于.docx,请使用docx2txt:

docx2txt foo.docx

后者将在与原始目录相同的目录中生成一个名为foo.txt的文件.

我不确定您使用的是哪个Linux发行版,但是例如,可以从Ubuntu存储库获得catdoc和docx2txt.

相关文章

Linux中的ARP防火墙主要用于防御ARP欺骗攻击,其效果取决于多...
insmod和modprobe加-f参数导致Invalid module format错误 这...
将ArchLinux安装到U盘 几个月前入门Arch的时候上网搜了不少安...
1、安装Apache。 1)执行如下命令,安装Apache服务及其扩展包...
一、先说一下用ansible批量采集机器信息的实现办法: 1、先把...
安装配置 1. 安装vsftpd 检查是否安装了vsftpd # rpm -qa | ...