如何进行窗口滑动以减小数据集的大小?

问题描述

我正在做一个使用手机传感器加速度计进行手势识别的机器学习项目。我也为此创建了自己的数据集。我的数据集有超过 330000 行。每个字母*主题显示使用了多少字母)组合具有不同的长度,因此我使用了 sample() 方法来确保每个组合的长度相同。采样后它有更多的行数(比如 500000)。

new_dataset = dataset.groupby(['alphabet','subject']).sample(n=1000,replace=True)

after sampling how data set looks

现在我需要以更有意义的方式减少行数,以便模型的准确性可以很高。我读了一些文章,它说“在 5 秒内提取一个滑动窗口与前一个窗口重叠 10%”,但我无法理解其背后的逻辑。如果您能提供帮助,我将不胜感激。最好用代码来表示,让我看的清楚。

谢谢。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)