通过使用多个数据集来改进单个数据集的模型预测

问题描述

有一个我正在研究的项目,正在遇到一个问题。本质上,我将这些点散布在x / y图上。我有一个测试点,可以在其中获得分类的目标数据(y)(1到6之间的数字)。我有很多要点,在这些地方有一些功能的深度索引数据。这些点的问题在于,我每点无法获取大量数据(也许100点)。

我正在使用最接近测试点的点来拟合模型,然后尝试将其推广到相距更远的其他点。它并没有给我带来很好的结果。

我知道没有足够的数据适合,所以我试图通过在测试点附近添加一组“ k”点来改进模型。

这些点都共享相同的列,因此我尝试垂直添加,但随后索引与预测变量y不匹配。

我尝试使用表示特定点ID的后缀在最后连接它们,但是当我尝试使用组合特征对模型进行再次预测时,我得到关于输入特征量(一个点)的错误

基本上我想做的是以下事情:

model.fit([X_1,X_2,X_3,X_4],y)

model.predict(X_5)

其中: 所有功能都是数字(浮点数)

X_1.columns = X_i.columns

每个X矩阵长约100点,并具有连续索引[0:100]。

每组点只有一个测试点(具有100个观测值),因此必须在尽可能接近测试点的地方使用尽可能多的数据。

我是否可以使用其他模型或技术?我对NN模型进行了更多的研究(不熟悉,因此宁愿避免使用),发现Keras能够使用其函数API接受多个输入以使其适合,但是我只能预测一个输入适合多个?

Keras Sequential model with multiple inputs

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)