问题描述
我正在使用依赖用户输入的文件。当然,此输入是不一致的,我不确定解决该问题的最佳方法是什么?我正在处理数字,我已经将其读为字符:
mydata$output1
[1] "PP150" NA "50,376.45\r\n" "40096.21" "43721.59" NA NA "27282272.16" NA
"50,376.45\r\n"
实际上在预览中显示为一个简单的数字,根据我有限的经验,我从未见过类似的东西。我该如何从中创建数字矢量?
我想得到:
[1] "PP150" NA "50376.45" "40096.21" "43721.59" NA NA "27282272.16" NA
解决方法
您可以使用gsub
删除不需要的字符:
x <- c("PP150",NA,"50,376.45\r\n","40096.21","43721.59","27282272.16",NA)
gsub('[,\r\n]','',x)
#[1] "PP150" NA "50376.45" "40096.21" "43721.59" NA NA "27282272.16" NA
由于“ PP150”不是数字,因此最终输出仍将是字符串。