有没有办法在Ubuntu上具有GPU加速的Anaconda中使用新的TF2对象检测API?

问题描述

GPU : NVIDIA RTX 2070 Super x2(带nvlink aka fancy SLI)
操作系统: Ubuntu 20.04
TF版本:TensorFlow 2.x(尝试x = 0、1、2、3,但最初从2.1.0开始)
型号:SSD MobileNet v2 320x320
包装管理器:点子和蟒蛇

我的目标是使用对象检测API从Anaconda环境中重新训练该模型。在使用TF 2.1.0正确设置并测试了我的GPU并设置了Anaconda环境后,我从jupyter笔记本中使用以下命令安装了对象检测API:

protoc object_detection/protos/*.proto --python_out=.
cp object_detection/packages/tf2/setup.py .
python3 -m pip install .

安装过程顺利进行,但是那时候一切都破灭了。 Obj-Det API的对应构建轮完全破坏了我以前使用的设置,卸载/重新安装了我的TensorFlow版本(2.1.0-> 2.3.0),并修改了一些依赖项。发生这种情况时,我的整个conda环境基本上都爆炸了,什么也没起作用。我收到诸如“ xxx.utils中没有模块xxx”之类的错误,这基本上意味着我到处都有冲突的库。找不到Cuda工具包,我尝试使用pip和conda软件包管理器卸载并重新安装各种版本的TF,结果变得一团糟。

当我使用conda安装所有组件时,一切运行良好。但是基本上,当我不得不使用pip安装对象检测工具时,我的conda环境就吓坏了。有人想出一种让他们一起玩的好方法吗?在放弃之前,我大概花了8个小时来解决这个问题,卸载了anaconda,卸载了所有cuda工具包/相关库,所有tensorflow / board相关库,并且在没有Anaconda的情况下从头开始。最终,它可以对所有内容使用pip进行工作,并手动确保我对所有内容都具有正确的版本依赖性并正在接受培训,但是我想知道那里是否有人为对象检测2.0 w设置了稳定的TF2 Anaconda环境。 Linux(Ubuntu 18 / 20.04)上的/ Nvidia-GPU加速,可以正确利用他们的GPU。如果我可以在一个独立的环境中收集所有这些库,那就太好了,任何技巧(或理想的分步指南)都将不胜感激。

谢谢!

(PS:我使用this colab来帮助指导我的过程,尽管我经常使用不同的数据集在本地运行所有内容,并使用SSD Mobilenet 32​​0x320模型而不是模型中列出的任何模型。 colab)

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)