pdftron中的句子提取

问题描述

我想通过鼠标悬停在 pdf 文档中该句子的每个单词上突出显示句子,我尝试了一些方法,但无法实现此目标。

pdftron 有没有办法做到这一点?

我想完成这个事件处理程序:

            WebViewer({
                path: '/assets/plugins/pdftron',initialDoc: '/practical.pdf',fullAPI: true,disableLogs: true
            },document.getElementById('pdf'))
                .then((instance) => {
                    const { PDFNet,docViewer } = instance;

                    const Tools = instance.Tools;

                    docViewer.on('mouseMove',(e) => {
                        console.log(e);
                    });
                    
                });

解决方法

您也许可以使用文本提取器从页面中获取文本,然后对其进行迭代以找到与鼠标位置相对应的部分 https://www.pdftron.com/documentation/web/guides/extraction/text-extract/#advanced-text-extraction-from-a-page-region

您可能需要将鼠标坐标转换为窗口坐标 https://www.pdftron.com/documentation/web/guides/coordinates/#converting-between-mouse-locations-and-window-coordinates,将窗口坐标转换为页面坐标 https://www.pdftron.com/documentation/web/guides/coordinates/#converting-between-window-and-viewer-page-coordinates,最后将页面坐标转换为 PDF 页面坐标 https://www.pdftron.com/documentation/web/guides/coordinates/#converting-between-pdf-and-viewer-coordinates 以与值进行比较来自文本提取器