尝试使用Tensorflow 2.3.0和Carla拟合模型时发生ValueError

问题描述

我正在关注Sentdex在Python 3中使用Carla进行自动驾驶的教程：（https://pythonprogramming.net/reinforcement-learning-self-driving-autonomous-cars-carla-python/）
我仔细地遵循了所有步骤，但是当我尝试运行代码时，出现以下错误：
ValueError：在启用了[eager]模式的情况下构造Model.fit实例时，不支持在图形模式下调用Model。请在图形模式下构建Model实例，或在启用快速模式的情况下调用Model.fit。
我认为此错误是由于本教程中使用的tensorflow版本与我正在运行的版本（2.3.0）之间的版本差异导致的。由于我在这个问题上停留了相当长的一段时间，所以对您的任何帮助都会非常感激。
我要运行的完整代码：
import glob
import os
import sys
import random
import time
import numpy as np
import cv2
import math
import tensorflow as tf
from tensorflow.python.keras import backend
from tensorflow.keras.callbacks import TensorBoard
from threading import Thread
from tensorflow.keras.applications.xception import Xception
from tensorflow.keras.layers import Dense,GlobalAveragePooling2D
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.models import Model
from collections import deque
from tqdm import tqdm

try:
    sys.path.append(glob.glob('../carla/dist/carla-*%d.%d-%s.egg' % (
        sys.version_info.major,sys.version_info.minor,'win-amd64' if os.name == 'nt' else 'linux-x86_64'))[0])
except IndexError:
    pass

import carla

MODEL_NAME = "Gijsw"
AGGREGATE_STATS_EVERY = 10
MIN_EPSILON = 0.001
EPSILON_DECAY = 0.95
EPISODES = 100
disCOUNT = 0.9
MIN_REWARD = -200
MEMORY_FRACTION = 0.8
UPDATE_TARGET_EVERY = 5
MINIBATCH_SIZE = 16
TRAINING_BATCH_SIZE = MINIBATCH_SIZE // 4
PREDICTION_BATCH_SIZE = 1
MIN_REPLAY_MEMORY_SIZE = 1_000
REPLAY_MEMORY_SIZE = 5_000 #5,000 
SECONDS_PER_EPISODE = 10.0
SHOW_PREVIEW = False

IM_WIDTH = 640
IM_HEIGHT = 480
epsilon = 1


# Own Tensorboard class
class ModifiedTensorBoard(TensorBoard):

    # Overriding init to set initial step and writer (we want one log file for all .fit() calls)
    def __init__(self,**kwargs):
        super().__init__(**kwargs)
        self.step = 1
        self.writer = tf.summary.create_file_writer(self.log_dir)

    # Overriding this method to stop creating default log writer
    def set_model(self,model):
        pass

    # Overrided,saves logs with our step number
    # (otherwise every .fit() will start writing from 0th step)
    def on_epoch_end(self,epoch,logs=None):
        self.update_stats(**logs)

    # Overrided
    # We train for one batch only,no need to save anything at epoch end
    def on_batch_end(self,batch,logs=None):
        pass

    # Overrided,so won't close writer
    def on_train_end(self,_):
        pass

    # Custom method for saving own metrics
    # Creates writer,writes custom metrics and closes writer
    def update_stats(self,**stats):
        self._write_logs(stats,self.step)


class CarEnv:
    SHOW_CAM = SHOW_PREVIEW
    STEER_AMT = 1.0
    front_camera = None

    def __init__(self):
        self.client = carla.Client("localhost",1234)
        self.client.set_timeout(5.0)

        # Once we have a client we can retrieve the world that is currently running.
        self.world = self.client.get_world()

        # The world contains the list blueprints that we can use for adding new actors into the simulation.
        self.blueprint_library = self.world.get_blueprint_library()
        self.model_3 = self.blueprint_library.filter("model3")[0]

    def reset(self):
        self.collision_hist = []
        self.actor_list = []
        
        self.transform = random.choice(self.world.get_map().get_spawn_points())
        self.vehicle = self.world.spawn_actor(self.model_3,self.transform)
        self.actor_list.append(self.vehicle)

        self.rgb_cam = self.blueprint_library.find('sensor.camera.rgb')
        self.rgb.set_attribute("image_size_x",f"{self.IM_WIDTH}")
        self.rgb.set_attribute("image_size_y",f"{self.IM_HEIGHT}")
        self.rgb.set_attribute("fov",f"110")

        transform = carla.Transform(carla.Location(x = 2.5,z = 0.7))
        self.sensor = self.world.spawn_actor(self.rgb_cam,transform,attach_to = self.vehicle)
        self.actor_list.append(self.sensor)
        self.sensor.listen(lambda data: self.process_img(data))

        self.vehicle.apply_control(carla.VehicleControl(throttle = 0.0,brake = 0.0))

        # sleep to get things started and to not detect a collision when the car spawns/falls from sky.
        time.sleep(4.0) 

        colsensor = self.blueprint_library.find("sensor.other.collision")
        self.colsensor = self.world.spawn_actor(colsensor,attach_to = self.vehicle)
        self.actor_list.append(self.colsensor)
        self.colsensor.listen(lambda event: self.collision_data(event))

        while self.front_camera is None:
            time.sleep(0.01)

        self.episode_start = time.time()
        self.vehicle.apply_control(carla.VehicleControl(throttle = 0.0,brake = 0.0))

        return self.front_camera

    def collision_data(self,event):
        self.collision_hist.append(event)

    def process_img(self,image):
        '''preproccess image data'''
    
        i = np.array(image.raw_data)
        i2 = i.reshape((self.IM_HEIGHT,self.IM_WIDTH,4))
        i3 = i2[:,:,:3]

        if self.SHOW_CAM:
            cv2.imshow("",i3)
            cv2.waitKey(1)      
        
        self.front_camera = i3

    def step(self,action):
        '''
        For Now let's just pass steer left,center,right?
        0,1,2
        '''

        if action == 0:
            self.vehicle.apply_control(carla.VehicleControl(throttle = 1.0,steer = -1*self.STEER_AMT))
        elif action == 1:
            self.vehicle.apply_control(carla.VehicleControl(throttle = 1.0,steer = 0))
        elif action == 2:
            self.vehicle.apply_control(carla.VehicleControl(throttle = 1.0,steer = 1*self.STEER_AMT))

        v = self.vehicle.get_veLocity()
        kmh = int(3.6 * math.sqrt(v.x**2 + v.y**2 + v.z**2))

        if len(self.collision_hist) != 0:
            done = True
            reward = -200

        elif kmh < 50:
            done = False
            reward = -1

        else:
            done = False
            reward = 1

        if self.episode_start + SECONDS_PER_EPISODE < time.time():
            done = True

        return self.front_camera,reward,done,None


class DQNAgent:
    def __init__(self):
        self.model = self.create_model()
        self.target_model = self.create_model()
        self.target_model.set_weights(self.model.get_weights())

        self.replay_memory = deque(maxlen = REPLAY_MEMORY_SIZE)

        self.tensorboard = ModifiedTensorBoard(log_dir = f"logs/{MODEL_NAME}-{int(time.time())}")
        self.target_update_counter = 0
        self.graph = tf.compat.v1.get_default_graph()

        self.terminate  = False
        self.last_logged_episode = 0
        self.training_initialized = False

    def create_model(self):
        base_model = Xception(weights=None,include_top=False,input_shape=(IM_HEIGHT,IM_WIDTH,3))
        x = base_model.output
        x = GlobalAveragePooling2D()(x)
        predictions = Dense(3,activation = "linear")(x)
        model = Model(inputs = base_model.input,outputs = predictions)
        model.compile(loss = "mse",optimizer = Adam(lr = 0.001),metrics = ["accuracy"])
        
        return model

    def update_replay_memory(self,transition):
        # transition = (current_state,action,new_state,done)
        self.replay_memory.append(transition)

    def train(self):
        if len(self.replay_memory) < MIN_REPLAY_MEMORY_SIZE:
            return

        minibatch = random.sample(self.replay_memory,MINIBATCH_SIZE)

        current_states = np.array([transition[0] for transition in minibatch]) / 255
        with self.graph.as_default():
            current_qs_list = self.model.predict(current_states,PREDICTION_BATCH_SIZE)

        new_current_states = np.array([transition[3] for transition in minibatch]) / 255
        with self.graph.as_default():
            future_current_qs_list = self.target_model.predict(new_current_states,PREDICTION_BATCH_SIZE)

        X = []
        y = []

        for index,(current_state,done) in enumerate(minibatch):
            if not done:
                max_future_q = np.max(future_current_qs_list[index])
                new_q = reward + disCOUNT * max_future_q

            else:
                new_q = reward

            current_qs = current_qs_list[index]
            current_qs[action] = new_q

            X.append(current_state)
            y.append(current_qs)

        log_this_step = False
        if self.tensorboard.step > self.last_logged_episode:
            log_this_step = True
            self.last_log_episode = self.tensorboard.step

        with self.graph.as_default():
            self.model.fit(np.array(X)/255,np.array(y),batch_size=TRAINING_BATCH_SIZE,verbose=0,shuffle=False,callbacks=[self.tensorboard] if log_this_step else None)

        if log_this_step:
            self.target_update_counter += 1

        if self.target_update_counter > UPDATE_TARGET_EVERY:
            self.target_model.set_weights(self.model.get_weights())
            self.target_update_counter = 0

    def get_qs(self,state):
        return self.model.predict(np.array(state).reshape(-1 *state.shape)/255)[0]

    def train_in_loop(self):
        X = np.random.uniform(size = (1,IM_HEIGHT,3)).astype(np.float32)
        y = np.random.uniform(size = (1,3)).astype(np.float32)
        with self.graph.as_default():
            self.model.fit(X,y,verbose = False,batch_size = 1)

        self.training_initialized = True

        while True:
            if self.terminate:
                return
            self.train()
            time.sleep(0.01)


if __name__ == '__main__':
    FPS = 20
    ep_rewards = [-200]
    random.seed(1)
    np.random.seed(1)
    tf.random.set_seed(1)
    #gpu_options = #tf.GPUOptions(per_process_gpu_memory_fraction = MEMORY_FRACTION)
    #gpu_options = tf.config.gpu.set_per_process_memory_fraction(MEMORY_FRACTION)
    #backend.set_session(tf.Session(config=tf.ConfigProto(gpu_options = gpu_options)))

    if not os.path.isdir("models"):
        os.makedirs("models")

    agent = DQNAgent()
    env = CarEnv()

    trainer_thread = Thread(target = agent.train_in_loop,daemon = True)
    trainer_thread.start()


    while not agent.training_initialized:
        time.sleep(0.01)

    agent.get_qs(np.ones((env.IM_HEIGHT,env.IM_WIDTH,3)))

    for episode in tqdm(range(1,EPISODES+1),ascii=True,unit="episodes"):
        env.collision_hist = []
        agent.tensorboard.step = episode
        episode_reward = 0
        step = 1
        current_state = env.reset()
        done = False
        episode_start = time.time()

        while True:
            if np.random.random() > epsilon:
                action = np.argmax(agent.get_qs(current_state))
            else:
                action = np.random.randint(0,3)
                time.sleep(1/FPS)

            new_state,_ = env.step(action)
            episode_reward += reward
            agent.update_replay_memory((current_state,done))
            step += 1
            
            if done:
                break

        for actor in env.actor_list:
            actor.destroy()



        # Append episode reward to a list and log stats (every given number of episodes)
        ep_rewards.append(episode_reward)
        if not episode % AGGREGATE_STATS_EVERY or episode == 1:
            average_reward = sum(ep_rewards[-AGGREGATE_STATS_EVERY:])/len(ep_rewards[-AGGREGATE_STATS_EVERY:])
            min_reward = min(ep_rewards[-AGGREGATE_STATS_EVERY:])
            max_reward = max(ep_rewards[-AGGREGATE_STATS_EVERY:])
            agent.tensorboard.update_stats(reward_avg=average_reward,reward_min=min_reward,reward_max=max_reward,epsilon=epsilon)

            # Save model,but only when min reward is greater or equal a set value
            if min_reward >= MIN_REWARD:
                agent.model.save(f'models/{MODEL_NAME}__{max_reward:_>7.2f}max_{average_reward:_>7.2f}avg_{min_reward:_>7.2f}min__{int(time.time())}.model')

        # Decay epsilon
        if epsilon > MIN_EPSILON:
            epsilon *= EPSILON_DECAY
            epsilon = max(MIN_EPSILON,epsilon)


    # Set termination flag for training thread and wait for it to finish
    agent.terminate = True
    trainer_thread.join()
    agent.model.save(f'models/{MODEL_NAME}__{max_reward:_>7.2f}max_{average_reward:_>7.2f}avg_{min_reward:_>7.2f}min__{int(time.time())}.model')
谢谢！
解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！
如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@）
carla python-3.x tensorflow tensorflow tensorflow