OCR开发包

Tesseract.js 识别图片语言的 JS 库

Tesseract.js Tesseract.js使用脚本标签，webpack / browserify和节点，安装之后，进行如下操作：

Pdfsandwich 运行效果获取代码将 PDF 文件转换成文本

Pdfsandwich 是将文本添加到图像形式的文本 PDF 文件 (如扫描书籍) 的工具。它使用光学字符识别(OCR)创建一个额外的图层，包含了原始页面已识别的文本。这对于复制和处理文本很有用。

OCRFeeder 开源 OCR 套件

OCRFeeder 是 GNOME 桌面下的一个开源 OCR 套件。可将纸质或者图形文档转成电子文档。

Pattern-lab 模式识别程序

Pattern-lab 是一个模式识别程序，专门为 OCR 而优化，但不限制于此。

Eye OCR 文字识别工具

Eye 是一个使用 Java 开发的文字识别工具（OCR），该工具主要用来识别屏幕上的文字，不支持中文。

YAGF OCR工具

YAGF 是 cuneiform 和 tesseract OCR 工具的图形化前端软件，可提供图片扫描和光学识别的功能。

GOCR OCR光学识别程序

GOCR 是一个开源的OCR光学识别程序。

OCRopus OCR识别

Ocropus的（TM）是一个先进的文件分析和OCR系统，采用可插入的布局分析，可插入的字符识别，自然语言统计建模和多语言支持功能。

WeOCR Web文字识别软件

WeOCR 是一个基于浏览器的文字识别服务，用户通过上传图片，WebOCR 从图片中识别出文本信息并返回结果给用户。WeOCR

FuzzyOcr 反垃圾邮件插件

FuzzyOCR，是一套修改自OcrPlugin的Spamassassin plugin。同样是利用光学字符辨认(OCR)的方式，来识别图像式邮件所包含的「文字讯息」，并利用Fuzzy word

Pyocr Python 的 OCR 库

Pyocr 是 OCR 引擎的简单 Python 封装，支持 Tesseract 和 Cuneiform 等。支持 Python 2.7 和 3.x，要求Pillow。

OCRKit 图片文字识别工具

OCRKit 是一款非常小巧的软件，直接拖拽，就能将pdf文档与图片转换为可检索的pdf文档。采用OCR (Optical Character

OcrPHP 使用 composer 安装开始使用 PHP 的 OCR 工具包

OcrPHP 是一个一个简洁优雅的图像识别转换文字的php类库, 须安装tesseract-ocr 使用 composer 安装

GNU Ocrad 光学文字识别

GNU Ocrad 是一个 OSR 光学文字识别程序，主要用于文本的识别，支持 pbm、pgm 和 ppm 格式，并输出 UTF-8 和 8位的文本格式。

flutter_ocr Flutter 开发的 OCR 软件

flutter_ocr 是用 Flutter 开发的使用百度 api 进行文字识别的拍照取字软件。包含了拍照，旋转，放大，拖拽来选取合适的大小和角度来截取要识别的图片内容。

C-OCR 携程 OCR 项目

C-OCR是携程自研的OCR项目，主要包括身份证、护照、火车票、签证等旅游相关证件、材料的识别。项目包含4个部分，拒识、检测、识别、后处理。

Tesseract OCR 图像识别类库

Tesseract OCR 该软件包包含一个OCR引擎 - libtesseract和一个命令行程序 - tesseract。 Tesseract

Cuneiform for Linux OCR文字识别系统

Cuneiform 是一个 OCR 文字识别系统的商标，最开始是由Cognitive 技术所开发的运行在 Windows 下的软件。而这个项目是该软件在

Lios Linux 的 OCR 解决方案

linux-intelligent-ocr-solution (Lios) 是Linux下一个开源的 OCR 解决方案，可将打印的文档转成可编辑的文本。

document-ocr 数据数据从网络抓取的公开上市公司年报数据 PDF 文件解析生成，有图片和文本的位置信息相关算法实现注文档分析和识别项目

document-ocr 一个相对完整的文档分析和识别项目含以下五部分: 1. 文档分析数据，

pytesser 图片文本识别的python模块

pytesser是一个用于图片文本识别的python模块，即从文本的截图中还原出文本信息

ocrstyle 图片识别文字

Optical Character Recognition 背景本程序最初是想用于发票识别的，目前可以通过ocrengine和imageprocess动态库进行二次开发。

Paperwork OCR 文档扫描和搜索工具

Paperwork 是一个 GUI 工具，可以使用 OCR 对纸张内容进行搜索。基本的思路就是“扫描然后忘记”。

MathOCR 数学公式识别系统

MathOCR是用Java语言编写的一个印刷体数学公式识别系统，可以识别图片中数学公式并转换为相应的LaTeX代码。

gscan2pdf PDF文字识别工具

将文档扫描成 PDF 格式很容易，但是能搜索它的内容吗？Gscan2pdf 采用光学识别软件对您的 PDF 文档进行扫描并将图像转换为文字。

Aspose.OCR for .NET

Aspose.OCR for .NET 是一个光学识别组件，可在 ASP .NET 的 Web 应用、Web 服务和应用程序中增加 OCR