在R中的同一文件中处理不同的数字格式

问题描述

我正在使用依赖用户输入的文件。当然,此输入是不一致的,我不确定解决该问题的最佳方法是什么?我正在处理数字,我已经将其读为字符:

mydata$output1
    [1] "PP150" NA "50,376.45\r\n" "40096.21" "43721.59" NA NA "27282272.16" NA  

"50,376.45\r\n"实际上在预览中显示为一个简单的数字,根据我有限的经验,我从未见过类似的东西。我该如何从中创建数字矢量?

我想得到:

[1] "PP150" NA "50376.45" "40096.21" "43721.59" NA NA "27282272.16" NA

解决方法

您可以使用gsub删除不需要的字符:

x <- c("PP150",NA,"50,376.45\r\n","40096.21","43721.59","27282272.16",NA)

gsub('[,\r\n]','',x)
#[1] "PP150"   NA  "50376.45" "40096.21" "43721.59"  NA  NA   "27282272.16" NA

由于“ PP150”不是数字,因此最终输出仍将是字符串。

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...