通过相对于连续变量对分类变量进行分组来替换分类变量的 NaN

问题描述

我在根据“温度”对“天气条件”进行分组时遇到问题,因为它是一个连续变量。因此,我需要通过将“温度”转换为 int64 然后替换“Weather cond”的 (by mode) NaN 来对其进行分组。但它不应将原始“温度”转换为 int64

DF 是:

temperature weather cond
    0   25.6    Cloudy
    1   28.7    Sunny
    2   26.9    NaN
    3   25.9    Cloudy
    4   29.9    Cloudy
    5   28.1    Overcast
    6   34.7    Sunny
    7   29.6    NaN
    8   26.6    NaN
    9   20.5    NaN

解释:

如果我们考虑温度 28.7 和 28.1,这些值应转换为 28(不在原始 df 中),然后用代表这些温度的“天气条件”模式填充 NaN。

注意:即使是近似值(地板/天花板)也被接受,即将 28.7 视为 29,将 28.1 视为 28。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)