问题描述
我尝试从这个人那里运行算法:https://github.com/theAIGuysCode/Object-Detection-API
我下载了所有要求,我猜算法仅在cpu上运行BUT。我的最高速度为2.5 FPS(这就是为什么我认为它在cpu而不是GPU上运行),而不是我需要的实时性。我不怎么“强制” Python在GPU上运行它以至少获得10 FPS。我尝试了不同版本的tensorflow和CUDA,但没有帮助。是否有人对此算法有相同的问题,或有任何解决办法的想法?我尝试甚至在2台不同的PC上运行此程序,但情况相同。在Linux(薄荷20)和Windows(10)上也有相同的结果。
我使用Dell Inspiron 17,图形卡为: Nvidia GeForce 940MX
CUDA版本:10.1
tensorflow-gpu == 2.1.0
解决方法
运行以下代码以查看Tensorflow是否检测到GPU。如果Number of GPU = 0,则没有检测到它。在这种情况下,如果您安装了Anaconda,我将使用Conda重新安装tensorflow。 Conda将安装tensorflow以及Cuda Toolkit和Cudnn。 Pip不会安装这两个项目,没有它们,tensorflow将不会使用GPU
import tensorflow as tf
from tensorflow.python.client import device_lib
print(device_lib.list_local_devices())
print(tf.__version__)
print("Num GPUs Available: ",len(tf.config.experimental.list_physical_devices('GPU')))
tf.test.is_gpu_available()
!python --version