如何增加分层样本,同时包含较小的先前获取的分层子样本

问题描述

我在Pyhton有一个问题,我想增加分层样本,但仍然包括较小的子样本。我先从1%的子样本开始,然后再以1%的样本增加直到10%。但是,当我使用train_test_split()执行此操作时。我得到了一个完全不同的数据集,不包括较小的数据集。不幸的是,我确实需要一种分层抽样方法。那么,如何更改以下代码以使其正常工作?

for i in range(1,11):
    percent_train_size = i/100
    
    Xsample,Xtest,ysample,ytest = train_test_split(X,y,stratify=y,train_size = percent_train_size,random_state = 0)

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)