通过使用多个数据集来改进单个数据集的模型预测

有一个我正在研究的项目，正在遇到一个问题。本质上，我将这些点散布在x / y图上。我有一个测试点，可以在其中获得分类的目标数据（y）（1到6之间的数字）。我有很多要点，在这些地方有一些功能的深度索引数据。这些点的问题在于，我每点无法获取大量数据（也许100点）。

我正在使用最接近测试点的点来拟合模型，然后尝试将其推广到相距更远的其他点。它并没有给我带来很好的结果。

我知道没有足够的数据适合，所以我试图通过在测试点附近添加一组“ k”点来改进模型。

这些点都共享相同的列，因此我尝试垂直添加，但随后索引与预测变量y不匹配。

我尝试使用表示特定点ID的后缀在最后连接它们，但是当我尝试使用组合特征对模型进行再次预测时，我得到关于输入特征量（一个点）的错误

基本上我想做的是以下事情：

model.fit([X_1,X_2,X_3,X_4],y)

model.predict(X_5)

其中：所有功能都是数字（浮点数）

X_1.columns = X_i.columns

每个X矩阵长约100点，并具有连续索引[0：100]。

每组点只有一个测试点（具有100个观测值），因此必须在尽可能接近测试点的地方使用尽可能多的数据。

我是否可以使用其他模型或技术？我对NN模型进行了更多的研究（不熟悉，因此宁愿避免使用），发现Keras能够使用其函数API接受多个输入以使其适合，但是我只能预测一个输入适合多个？

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）