如何从该图像中获取数据?

问题描述

我有一个网站,向我显示有关卡丁车比赛的信息(例如最后一圈时间,最佳一圈时间,完成几圈...),我想获取此数据以创建数据库以用于耐力策略。我不想在excel工作表上手动输入数据,因此我试图获取屏幕截图并应用OCR转换为文本。我正在使用Python和Tesseract尝试这种方式:

#import libs
import PyTesseract as ocr
import numpy as np
import cv2
from PIL import Image

#convert to RGB and keep green channel
npimagem = np.asarray(Image.open('race.png').convert('RGB')).astype(np.uint8)
npimagem[:,:,0] = 0
npimagem[:,2] = 0

#convert to gray
im = cv2.cvtColor(npimagem,cv2.COLOR_RGB2GRAY)

ret,thresh = cv2.threshold(im,127,255,cv2.THRESH_BINARY | cv2.THRESH_OTSU)
binimagem = Image.fromarray(thresh)

text = ocr.image_to_string(binimagem,lang='eng')

结果如下: *会议:F4 DRIVERS / PROVA 4-21:30 时间:00:00:00 参见Cem)

21:59:34 撒尿 ot

#035 ALEXANDRE CURY Fa privers

1 Cred ee ee Tg ia ee)ee SE} ri coe P#012 PAULO ALEX ra privers 认证的CEE EES ri Pert coe Pert 3#000 DANIEL LUTFI Fa平民 经认证的最佳合作伙伴:17个erle ri Cea)coe rx} mn#046 ANDERSON SILVA Fa privers 信用证(ERA EE)EE ER CE(COE)0.200 5 Gath C10 smn 721或Beano) Cred Tecate Cieza eae ese Cea RSS差异:10.405 coe cary 6#032 LUIZ RUBELLO Fa平民 证书差距(Eee Pe esel Gap:14.479) ,#022 DANILO PACINI Fa privers Cred ea ee eae eae aed Corer aS eyed coe at) 8#013 EDUARDO RECHE Fa平民 最佳成绩:17 Cee ee ee Py eis C) PD#028拉斐尔·米切莱蒂 Cred eee ee te Se)ia ey em [ec] coe Cel) 10#068 MANOEL PIMENTEL Fa平民 Cees)ee Ee ea ena梨梨CS aT

SEO Ret ee是信使| 由Race-Monitor.com带给您*

我怎样才能使文本更真实?图像质量还不错...

屏幕截图1

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)