问题描述
我正在编写一个应用程序,您可以用它为文本拍照,然后扫描文本并将其传输到变量。我已经使用插件firebase_ml_vision完成了此工作,一切正常。
我的问题是我想自己决定从照片中扫描哪些文本。例如,这可以这样一种方式工作,即自动为每个单词和数字赋予一个框架,然后用户点击传送到变量的单词。这也适用于Google翻译(请参见屏幕截图),但不幸的是,我还没有找到任何操作方法...您知道它如何工作吗?
解决方法
firebase-mlkit的文本识别API为frame
,cornerPoints
和VisionTextBlock
中的每一个返回VisionTextLine
和VisionTextElement
:>
他们应该帮助您选择单词,行或文本块。