问题描述
帮助大家,我正在尝试使用函数估算缺失值,该函数本身在这方面有效,但无法存储估算值。
下图为函数,gh_Df为数据集; val
是 FacilityName 变量中的值,lat
和 long
分别是我希望填充的值。
fill_lat_long_na <- function(val,lat,long){
if(is.na(gh_Df[gh_Df$FacilityName == val,]$Latitude)){
gh_Df[gh_Df$FacilityName == val,]$Latitude <- lat
gh_Df[gh_Df$FacilityName == val,]$Longitude <- long
}
print(gh_Df[gh_Df$FacilityName == val,])
}
## Check
fill_lat_long_na("Yapesa St.Mary Clinic",6.43011,-1.33299)
结果
纬度 | 经度 |
---|---|
6.43011 | -1.33299 |
但是,如果我返回并在函数外运行以下内容,它仍会显示空/NA 行。
print(gh_Df[gh_Df$FacilityName == "Yapesa St.Mary Clinic",])
结果
纬度 | 经度 |
---|---|
不适用 | 不适用 |
有没有办法解决这个问题,并且数据集内的值实际上会发生变化?
谢谢。
解决方法
通常从函数内部更改数据框不是一个好习惯。您可以 return
更改的数据框并将其保存在函数之外。
fill_lat_long_na <- function(val,lat,long){
if(is.na(gh_Df[gh_Df$FacilityName == val,]$Latitude)){
gh_Df[gh_Df$FacilityName == val,]$Latitude <- lat
gh_Df[gh_Df$FacilityName == val,]$Longitude <- long
}
return(gh_Df)
}
gh_Df <- fill_lat_long_na("Yapesa St.Mary Clinic",6.43011,-1.33299)
gh_Df