内置训练功能比自定义训练功能好得多

问题描述

我正在尝试训练用于房价预测的线性回归模型。我尝试了三种方法。

自定义梯度下降算法
自定义正规方程算法
sklearn 提供的内置函数

我通过 r 平方值评估了所有三个模型，如下所示：

自定义梯度算法的 R 平方：-4.01
自定义 normal_equation 算法的 R 平方：-95.38
内置函数算法的 R 平方：0.54

现在我不明白为什么两个自定义算法的 r 平方值为负。代码提供如下。为所有三种方法提供相同的数据。

    def hypothesis(self,input_data):
        # input data: (1382,22),features: (22,),prediction: (1382,)
        prediction = np.matmul(input_data,self.features)
        return prediction
    
    def cost(self,predicted,actual):
        cost = np.sum(np.square(predicted- actual)) / len(predicted) / 2
        # predicted: (1382,actual: (1382,cost: float number
        return cost
    
    def gradient_descent(self,alpha,prediction,actual):
        self.features -= alpha * (np.matmul(self.train_x.T,(prediction - actual))) / len(prediction)
        # prediction: (1382,alpha: 0.001,)
        
    def normal_equation(self,X,y):
        self.features = np.matmul(np.matmul(np.linalg.inv(np.matmul(X.T,X)),X.T),y)
        #X.shape: (1382,y.shape: (1382,)
        
    def built_in_train(self):
        reg = LinearRegression().fit(self.train_x,self.train_y)
        #train_x: (1382,train_y: (1382,)
        return reg
        
    def train(self,epoch,normal_equation=False,builtin_function=False):
        if(normal_equation):
            self.normal_equation(self.train_x,self.train_y)
            return None
        elif (builtin_function):
            return self.built_in_train()
        else: 
            for i in range(0,epoch):
                prediction = self.hypothesis(self.train_x)
                cost = self.cost(prediction,self.train_y)
                self.train_cost_history.append(cost)
                self.gradient_descent(alpha,self.train_y)
            return None

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

gradient-descent linear-regression numpy python