如何将带有复数的txt文件导入R?

问题描述

我想将一个 txt 文件导入 R 中,其中包含一些复数。数据集有一个标题并以空格分隔,小数点以点分隔。按照印象数据集的样子:

a b c
1606315601.36889 -0.0119374750903214 0.0362932827218628
1606940201.38086 -0.0121142788819912 0.0360182146610096
1606210201.38693 -0.0124296203543005 0.0332458188804718
1606336201.3989 -0.0124724358297131 0.0355308140075942
1606312801.41093 -0.0126693799402413 0.0354588503147717

我曾多次尝试导入数据集,但失败了,我丢失了存储在 txt 文件中的数字的精度。 有谁知道如何将 txt 文件导入 R 中保留复数?

#--------------------------------------------------------------------------------------------------
# 1st attempt

test <- base::as.data.frame(base::matrix(data = base::scan(file = test_dir,skip = 1,sep = '',dec = '.',what = 'complex'),ncol = 3,byrow = TRUE),stringsAsFactors = FALSE)
# read the txt-file and store it as a dataframe

class(test$V1)
# query whether the numbers have been read as complex numbers
[1] "character"

#---------------------------------------------------------------------------------------------------
# 2nd attempt

test <- utils::read.table(file = test_dir,numerals = 'no.loss',colClasses = 'complex')
# read the txt-file

base::head(test,n = 5)
# print the first 5rows of the txt-file --> this will just print rounded values

解决方法

可以像往常一样使用 read.table 等从文本文件或内联文本中读取数据,如下例所示:

df <- read.table(text='
a b c
1606315601.36889 -0.0119374750903214 0.0362932827218628
1606940201.38086 -0.0121142788819912 0.0360182146610096
1606210201.38693 -0.0124296203543005 0.0332458188804718
1606336201.3989 -0.0124724358297131 0.0355308140075942
1606312801.41093 -0.0126693799402413 0.0354588503147717                 
',colClasses="complex",header=TRUE)

str(df)

'data.frame':   5 obs. of  3 variables:
 $ a: cplx  1.61e+09+0i 1.61e+09+0i 1.61e+09+0i ...
 $ b: cplx  -0.0119+0i -0.0121+0i -0.0124+0i ...
 $ c: cplx  0.0363+0i 0.036+0i 0.0332+0i ...

如果从值中可以清楚地看出复杂性,没有 colClasses 选项:

df <- read.table(text = '
a b c
2+5i 6.3  0+1i
1.3  7.8  6.0
',header=TRUE)

str(df)

'data.frame':   2 obs. of  3 variables:
 $ a: cplx  2+5i 1.3+0i
 $ b: num  6.3 7.8
 $ c: cplx  0+1i 6+0i

如果您的数据位于外部文件中,请将参数 text 替换为文件名。

read.table("file.txt",header=TRUE)

如果列类型混合使用 colClasses 向量或自动检测。

,

就像@Paul 在评论中写道:

utils::read.table(file = test_dir,skip = 1,sep = '',dec = '.',numerals = 'no.loss')

工作正常! 但它更多的是一种打印现象,很容易解决:

base::options(digits = 20)

(这只会打印比默认值更多的数字)。非常感谢您的帮助,@Paul! :)