Tesseract.js Tesseract.js使用脚本标签,webpack / browserify和节点,安装之后,进行如下操作:
Pdfsandwich 是将文本添加到图像形式的文本 PDF 文件 (如扫描书籍) 的工具。它使用光学字符识别(OCR)创建一个额外的图层,包含了原始页面已识别的文本。这对于复制和处理文本很有用。
OCRFeeder 是 GNOME 桌面下的一个开源 OCR 套件。可将纸质或者图形文档转成电子文档。
Pattern-lab 是一个模式识别程序,专门为 OCR 而优化,但不限制于此。
Eye 是一个使用 Java 开发的文字识别工具(OCR),该工具主要用来识别屏幕上的文字,不支持中文。
YAGF 是 cuneiform 和 tesseract OCR 工具的图形化前端软件,可提供图片扫描和光学识别的功能。
GOCR 是一个开源的OCR光学识别程序。
Ocropus的(TM)是一个先进的文件分析和OCR系统,采用可插入的布局分析,可插入的字符识别,自然语言统计建模和多语言支持功能。
WeOCR 是一个基于浏览器的文字识别服务,用户通过上传图片,WebOCR 从图片中识别出文本信息并返回结果给用户。WeOCR
FuzzyOCR,是一套修改自OcrPlugin的Spamassassin plugin。同样是利用光学字符辨认(OCR)的方式,来识别图像式邮件所包含的「文字讯息」,并利用Fuzzy word
Pyocr 是 OCR 引擎的简单 Python 封装,支持 Tesseract 和 Cuneiform 等。支持 Python 2.7 和 3.x,要求Pillow。
OCRKit 是一款非常小巧的软件,直接拖拽,就能将pdf文档与图片转换为可检索的pdf文档。采用OCR (Optical Character
OcrPHP 是一个一个简洁优雅的图像识别转换文字的php类库, 须安装tesseract-ocr 使用 composer 安装
GNU Ocrad 是一个 OSR 光学文字识别程序,主要用于文本的识别,支持 pbm、pgm 和 ppm 格式,并输出 UTF-8 和 8位的文本格式。
flutter_ocr 是用 Flutter 开发的使用百度 api 进行文字识别的拍照取字软件。 包含了拍照,旋转,放大,拖拽来选取合适的大小和角度来截取要识别的图片内容。
C-OCR是携程自研的OCR项目,主要包括身份证、护照、火车票、签证等旅游相关证件、材料的识别。 项目包含4个部分,拒识、检测、识别、后处理。
Tesseract OCR 该软件包包含一个OCR引擎 - libtesseract和一个命令行程序 - tesseract。 Tesseract
Cuneiform 是一个 OCR 文字识别系统的商标,最开始是由Cognitive 技术所开发的运行在 Windows 下的软件。而这个项目是该软件在
linux-intelligent-ocr-solution (Lios) 是Linux下一个开源的 OCR 解决方案,可将打印的文档转成可编辑的文本。
pytesser是一个用于图片文本识别的python模块,即从文本的截图中还原出文本信息
Optical Character Recognition 背景 本程序最初是想用于发票识别的,目前可以通过ocrengine和imageprocess动态库进行二次开发。
Paperwork 是一个 GUI 工具,可以使用 OCR 对纸张内容进行搜索。基本的思路就是“扫描然后忘记”。
MathOCR是用Java语言编写的一个印刷体数学公式识别系统,可以识别图片中数学公式并转换为相应的LaTeX代码。
将文档扫描成 PDF 格式很容易,但是能搜索它的内容吗?Gscan2pdf 采用光学识别软件对您的 PDF 文档进行扫描并将图像转换为文字。
Aspose.OCR for .NET 是一个光学识别组件,可在 ASP .NET 的 Web 应用、Web 服务和应用程序中增加 OCR