问题描述
我有一个R数据帧,需要将其拆分为训练和测试数据集。但是,原始数据帧包含某些列的一些NA
值。
如果我用一个例子解释一下,
数据框包含一组人员的反馈,一个变量用于存储他们获得第一份工作的年份或开始在工程团队工作的年份,并存储在numeric
变量中,例如YearOfFirstJob
或{{ 1}}。因此,对于尚未找到工作的人或从未在工程团队中工作的人来说,这些值将是YearJoinedEngineeringTeam
。
由于无法删除这些观察值,因此我考虑将变量中的数据表示形式更改为NA
,YeaRSSinceFirstJob
之类的东西,因此可以将所有YearSinceJoiningEngineeringTeam
值替换为零。但是,数据框中还有其他NA
种变量,并且没有适当的时间点来计算值。其次,我想将它们转换为NumberOfYears
,以便可以用factors
之类的字符串替换NA
值。
我的问题是
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)