问题描述
我正在尝试使用appimagetool
(https://appimage.org/)创建OCR程序tesseract
(https://github.com/tesseract-ocr)的单二进制可执行文件。我已经在Ubuntu 19.10上构建了tesseract,并且我希望可执行文件可以在Ubuntu 14.01上运行。
注意:我无法控制旧版本的Ubuntu,并且我需要后期版本的tesseract中的功能。我已经尝试过现有的tesseract AppImage,但失败的方式与下面详述的类似。
本教程后的内容:https://appiomatic.com/blog/creating-appimage-binary-manually-for-linux-from-your-app/我创建了一个tesseract.AppDir
并具有必需的布局:
tesseract.AppDir/AppRun
tesseract.AppDir/.DirIcon
tesseract.AppDir/tesseract.desktop
tesseract.AppDir/tesseract.png
tesseract.AppDir/usr
tesseract.AppDir/usr/bin
tesseract.AppDir/usr/bin/tesseract
tesseract.AppDir/usr/lib
tesseract.AppDir/usr/lib/libtesseract.so.5
tesseract.AppDir/usr/lib/libtesseract.so.5.0.0
...
tesseract.AppDir/usr/share
tesseract.AppDir/usr/share/tessdata
tesseract.AppDir/usr/share/tessdata/eng.traineddata
...
tesseract.AppDir/usr/share/tessdata/tessconfigs
...
并创建了AppImage:
[Ubuntu 19.10]$ ~/Downloads/appimagetool-x86_64.AppImage tesseract.AppDir
appimagetool,continuous build (commit effcebc),build 2084 built on 2019-05-01 21:02:41 UTC
Using architecture x86_64
/home/kingsley/Software/Tesseract/tesseract/tesseract.AppDir should be packaged as Tesseract-OCR-x86_64.AppImage
Generating squashfs...
Parallel mksquashfs: Using 6 processors
Creating 4.0 filesystem on Tesseract-OCR-x86_64.AppImage,block size 131072.
[=======================================================================================================================|] 1921/1921 100%
Exportable Squashfs 4.0 filesystem,gzip compressed,data block size 131072
compressed data,compressed Metadata,compressed fragments,compressed xattrs
duplicates are removed
Filesystem size 73511.40 Kbytes (71.79 Mbytes)
30.95% of uncompressed filesystem size (237490.75 Kbytes)
Inode table size 5971 bytes (5.83 Kbytes)
57.29% of uncompressed inode table size (10423 bytes)
Directory table size 1019 bytes (1.00 Kbytes)
56.90% of uncompressed directory table size (1791 bytes)
Number of duplicate files found 0
Number of inodes 92
Number of files 78
Number of fragments 5
Number of symbolic links 3
Number of device nodes 0
Number of fifo nodes 0
Number of socket nodes 0
Number of directories 11
Number of ids (unique uids + gids) 1
Number of uids 1
root (0)
Number of gids 1
root (0)
Embedding ELF...
Marking the AppImage as executable...
Embedding MD5 digest
Success
但是,将其复制到较旧的系统后,将无法运行,表示它丢失了libpng16.so.16
。
[Ubuntu14]$ ./Tesseract-OCR-x86_64.AppImage
tesseract: error while loading shared libraries: libpng16.so.16: cannot open shared object file: No such file or directory
进一步的研究使我相信我必须手动复制所有依赖项。
因此在ldd
可执行文件上使用tesseract
:
[Ubuntu 19.10]$ ldd LOCAL_INSTALL/bin/tesseract
linux-vdso.so.1 (0x00007fffd7937000)
libtesseract.so.5 => not found
liblept.so.5 => /usr/lib/x86_64-linux-gnu/liblept.so.5 (0x00007f44c03d3000)
libpthread.so.0 => /lib/x86_64-linux-gnu/libpthread.so.0 (0x00007f44c03b0000)
libstdc++.so.6 => /usr/lib/x86_64-linux-gnu/libstdc++.so.6 (0x00007f44c01c2000)
libgcc_s.so.1 => /lib/x86_64-linux-gnu/libgcc_s.so.1 (0x00007f44c01a8000)
libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007f44bffb7000)
libpng16.so.16 => /usr/lib/x86_64-linux-gnu/libpng16.so.16 (0x00007f44bff7d000)
libjpeg.so.8 => /usr/lib/x86_64-linux-gnu/libjpeg.so.8 (0x00007f44bfef8000)
libgif.so.7 => /usr/lib/x86_64-linux-gnu/libgif.so.7 (0x00007f44bFeed000)
libtiff.so.5 => /usr/lib/x86_64-linux-gnu/libtiff.so.5 (0x00007f44bfe6c000)
libwebp.so.6 => /usr/lib/x86_64-linux-gnu/libwebp.so.6 (0x00007f44bfc03000)
libopenjp2.so.7 => /usr/lib/x86_64-linux-gnu/libopenjp2.so.7 (0x00007f44bfbad000)
libm.so.6 => /lib/x86_64-linux-gnu/libm.so.6 (0x00007f44bfa5c000)
libz.so.1 => /lib/x86_64-linux-gnu/libz.so.1 (0x00007f44bfa40000)
/lib64/ld-linux-x86-64.so.2 (0x00007f44c0706000)
libzstd.so.1 => /usr/lib/x86_64-linux-gnu/libzstd.so.1 (0x00007f44bf999000)
liblzma.so.5 => /lib/x86_64-linux-gnu/liblzma.so.5 (0x00007f44bf972000)
libjbig.so.0 => /usr/lib/x86_64-linux-gnu/libjbig.so.0 (0x00007f44bf764000)
然后我将所有共享库复制到tesseract.AppDir/usr/lib/
中,并再次重建AppImage。
在Ubuntu 14上的测试仍然失败:
[Ubuntu14]$ ./Tesseract-OCR-x86_64.AppImage
Segmentation fault (core dumped)
Segmentation fault (core dumped)
Segmentation fault (core dumped)
Segmentation fault (core dumped)
编辑:我尝试制作AppImage,将中间的.so文件一个接一个地添加。只有当我最终在libc.so.6
中复制时,我才得到了段。故障。但是,如果我不使用此库,则可执行文件运行将失败,并显示以下信息:
tesseract: /lib/x86_64-linux-gnu/libc.so.6: version `GLIBC_2.22' not found (required by /tmp/.mount_Tesser6wDkZB/lib/liblept.so.5)
似乎liblept.so.5
是问题所在。
现在我几乎没有主意了。
- 这不是AppImages的用例吗?
- 有没有办法调试出什么问题了?
- 有没有一种工具可以自动找到依赖关系?
- Ubuntu 14.01只是目标太旧了,我应该放弃并重新使用
gocr
。
解决方法
这不是AppImages的用例吗?
肯定是有效的用例。
有没有办法调试出什么问题了?
是的,您可以使用strace
和LD_DEBUG=libs
环境变量来查看正在加载的内容。有关调试AppImage的更多信息,请检查:
有没有自动找到依赖关系的工具?
是的,请检查https://github.com/AppImage/awesome-appimage#build-systems
您应该使用哪种应用取决于您的应用程序是否可以在最旧的稳定系统上构建。如果答案为是,则可以使用linuxdeploy
,否则可以使用appmage-builder
。我建议阅读this entry来确定使用哪种工具。
Ubuntu 14.01是否太老了,我应该放弃并重新使用gocr。
您可以使用appimage-builder在ubuntu 20.04中构建AppImage。
,如果有人在这里寻找如何实际解决此问题的方法,这就是我的解决方法。
通过一个接一个地添加库,我可以确定问题的核心是liblept.so.5
是使用GLIBC 22.2编译的,而Ubuntu 14目标没有此库。我发现这是出现此问题的 only 库。
但是,仅包含libc.so.6
也会引起所有这些Segmentation错误。我不知道为什么会这样-仍然想知道为什么。所以我四处寻找替代品。
我尝试的一种方法是编译tesseract以与静态的liblept链接,但这并不能立即起作用,因此我没有时间进行全面研究。也许这是一个好方法。最终,我估计编译了一个本地的leptonica库,因此存在.so的本机Ubuntu 14版本,而App Image只会使用它。
显然,这不是最佳解决方案,因为它没有包含在软件包中,但这足以使它对我有用。