我的问题是:这是真的吗?目前最先进的技术是如此优秀 – 对于良好的英文文本扫描 – 没有任何重大改进吗?
或者,这个问题的一个不那么主观的形式是:现代OCR系统在识别英文文本以获得高质量扫描时有多准确?
开始玩那些参数,例如,古怪的未知字体,嘈杂的扫描,亚洲字符,它开始变得有点片状或需要额外的输入.许多着名的Ominfont系统都不能很好地处理连字.
OCR的主要问题是理解输出.如果这是一个已解决的问题,谷歌图书将提供完美的结果.