运行apache tika和视觉服务器时出错

问题描述

我正在试用apache tika的功能,并在设置并运行tika和张量流识别服务器后出现以下错误

我使用docker安装并遵循了文档中的这些说明

a。使用docker(推荐)

  1. git clone https://github.com/USCDataScience/tika-dockers.git && cd tika-dockers
  2. docker build -f InceptionRestDockerfile -t uscdatascience / inception-rest-tika。
  3. docker run -p 8764:8764 -it uscdatascience / inception-rest-tika
  4. 完成后,通过访问http:// localhost:8764 / inception / v4 / classify / image?topn = 2&min_confidence = 0.03&url = https://upload.wikimedia.org/wikipedia/commons/来测试设置在您的网络浏览器中f / f6 / Working_Dogs%2C_Handlers_Share_Special_Bond_DVIDS124942.jpg。

并出现以下错误


Traceback (most recent call last):

File "/usr/bin/inceptionapi",line 237,in <module>

app = Classifier(__name__)

File "/usr/bin/inceptionapi",line 194,in __init__

self.names = create_readable_names_for_imagenet_labels()

File "/usr/bin/inceptionapi",line 138,in create_readable_names_for_imagenet_labels

assert num_synsets_in_ilsvrc == 1000

AssertionError

tika视觉视频也出现了相同的错误,但是图像字幕API可以正常工作,有人可以帮我解决这个问题

解决方法

断言错误是因为由于Tensorflow项目将其移至其驻留位置而无法下载某些 imagenet 数据,因此该数据在运行时不存在。 InceptionVideoRestDockerfile和InceptionRestDockerfile都会受到影响。

我已经创建了一个Fork,并进行了必要的更改,并向USC的团队提交了拉取请求here。使用更新的URL允许这些Docker映像加载模型。反过来,这又允许它们在Apache Tika中使用。