如何从linux中的GUI应用程序中提取文本内容?

我想从GUI应用程序中提取文本内容,这里有两个例子::

例1:

假设我打开了firefox,输入了url:www.google.com

如何使用自己的应用程序从firefox中提取字符串“www.google.com”?

例2:

打开计算器(使用gcalctool),然后输入1 1

如何从我自己的程序中提取计算器的字符串“1 1”?

简而言之,我想要的是找出是否有办法从GUI应用程序的任何小部件中提取文本内容

谢谢

最佳答案
我不认为这是一种通用的方法,至少不是一个非常优雅的方法.

一些不优雅的想法:

您可以修改X窗口系统甚至某些工具包框架,以将特定窗口元素中显示的内容提取为文本.

您可以截取屏幕截图并使用OCR库将像素转换回有趣区域的文本.

您可以重新编译感兴趣的应用程序,以添加某种机制来询问他们的问题.

您可以使用xtest之类的东西来注入突出显示感兴趣区域的事件并将其复制到剪贴板.

相关文章

linux常用进程通信方式包括管道(pipe)、有名管道(FIFO)、...
Linux性能观测工具按类别可分为系统级别和进程级别,系统级别...
本文详细介绍了curl命令基础和高级用法,包括跳过https的证书...
本文包含作者工作中常用到的一些命令,用于诊断网络、磁盘占满...
linux的平均负载表示运行态和就绪态及不可中断状态(正在io)的...
CPU上下文频繁切换会导致系统性能下降,切换分为进程切换、线...