如何在nodejs中下载tesseract的预处理图像

问题描述

根据我的理解,tesseract.js 在尝试处理上传的图像之前会对其应用过滤器。但是,图像质量可能仍然很差。为了确保图像看起来不错,tesseract 提供了一个选项,可以在应用过滤器后下载图像。 在文档中它指出:

您可以看到 Tesseract 如何通过使用 配置变量 tessedit_write_images 为 true

这就是问题所在。我似乎找不到将 tessedit_write_images 设置为 true 的方法。我到处查看如何在 nodejs 中执行此操作,但找不到答案。

我尝试通过向其中添加 tessedit_write_images = true修改文档(在下面发布)中提供的示例代码,但没有奏效:

const { createWorker } = require('tesseract.js');

const worker = createWorker();

(async () => {
  await worker.load();
  await worker.loadLanguage('eng');
  await worker.initialize('eng');
  await worker.setParameters({
    tessedit_char_whitelist: '0123456789',tessedit_write_images : true // added this but typescript gives an error
  });
  const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png');
  console.log(text);
  await worker.terminate();
})();



解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)