如何从扫描的照片中选择文本？

我正在编写一个应用程序，您可以用它为文本拍照，然后扫描文本并将其传输到变量。我已经使用插件firebase_ml_vision完成了此工作，一切正常。

我的问题是我想自己决定从照片中扫描哪些文本。例如，这可以这样一种方式工作，即自动为每个单词和数字赋予一个框架，然后用户点击传送到变量的单词。这也适用于Google翻译（请参见屏幕截图），但不幸的是，我还没有找到任何操作方法...您知道它如何工作吗？

firebase-mlkit的文本识别API为frame，cornerPoints和VisionTextBlock中的每一个返回VisionTextLine和VisionTextElement：>

他们应该帮助您选择单词，行或文本块。

相关问答