如何使用Tesseract / Python使用.png中的坐标提取文本？

问题描述

我正在尝试给我的脚本“ X”坐标，我要检索的文本在哪里，以后用该文本命名.png。关键是脚本会读取整个.png并给我所有文本。我需要给脚本一个坐标（我有），然后只检索我正在寻找的单词

import os
import cv2
import PyTesseract
import numpy as np
from PIL import ImageGrab
import time


PyTesseract.PyTesseract.tesseract_cmd = 'C:\\Program Files\\Tesseract-OCR\\tesseract.exe'
img = cv2.imread('example-1.png')
img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB)
resultado = print(PyTesseract.image_to_string(img))

#############################################
#### Detect characters ######
#############################################
hImg,wImg,_ = img.shape
Boxes = PyTesseract.image_to_Boxes(img)


for b in Boxes.splitlines():
    # print(b)
    b = b.split(' ')
    # print(b)
    x,y,w,h = int(b[1]),int(b[2]),int(b[3]),int(b[4])
    cv2.rectangle(img,(x,hImg- y),(w,hImg- h),(50,50,255),2)
    cv2.putText(img,b[0],hImg- y+25),cv2.FONT_HERShey_SIMPLEX,1,2)
    print(b)

cv2.imshow('img',img)
cv2.waitKey(0)

.png中单词的坐标是这些

['183','2157','203','2197','0']
['230','250','2199','0']
['254','274','2187','0']
['301','319','0']
['324','345','0']
['352','362','0']
['376','386','0']
['395','415','0']

谢谢！问候。

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

pdf python tesseract