写入“ .csv”后,如何恢复Array {Tuple {Int64,Int64},1}的原始数据类型-朱莉娅

问题描述

我有一个要写入文件的元组列表的列表,以便可以被另一个文件读入以进行后处理。如果它有助于其图中的循环列表,则每个循环循环本身就是一个元组列表。我将此列表称为cycle_basis

目前这是我的写法:

df = DataFrame()
df.Path = cycle_basis
df.Size = cycle_size
CSV.write("cycle_basis.csv",df)

cycle_size只是一个整数,代表每个循环中的边数。我可以看到它以如下方式存储在CSV中(出于这篇文章的缘故,它运行在一个超小的图上,通常该文件要长得多):

Path,Size
"[(1,3),(2,(1,2)]",3
"[(4,5),(3,4),5

我尝试将每个字符串转换为原始字符串,如下所示:convert(Array{Tuple{Int64,Int64},1},cycle.Path[1]),但这只是给了我以下错误:

    ERROR: MethodError: Cannot `convert` an object of type String to an object of type                                  Array{Tuple{Int64,1}
Closest candidates are:
  convert(::Type{Array{S,N}},::PooledArrays.PooledArray{T,R,N,RA} where RA) where {S,T,N} at /home/charper/.julia/packages/PooledArrays/yiLq3/src/PooledArrays.jl:294
  convert(::Type{T},::AbstractArray) where T<:Array at array.jl:533
  convert(::Type{T},::T) where T<:AbstractArray at abstractarray.jl:14
  ...
Stacktrace:
 [1] top-level scope at none:0

我用parse()尝试了同样的操作,并得到了类似的错误。

解决方法

我不建议将CSV存储用于此类数据。可能最简单的方法是JSONTables.jl:

julia> df = DataFrame(a=[1,2],b=[[(1,2),(3,4)],[(5,6),(7,8)]])
2×2 DataFrame
│ Row │ a     │ b                │
│     │ Int64 │ Array…           │
├─────┼───────┼──────────────────┤
│ 1   │ 1     │ [(1,4)] │
│ 2   │ 2     │ [(5,8)] │

julia> s = arraytable(df) 
"[{\"a\":1,\"b\":[[1,[3,4]]},{\"a\":2,\"b\":[[5,6],[7,8]]}]"

julia> DataFrame(jsontable(s))
2×2 DataFrame
│ Row │ a     │ b                │
│     │ Int64 │ Array…           │
├─────┼───────┼──────────────────┤
│ 1   │ 1     │ [[1,4]] │
│ 2   │ 2     │ [[5,8]] │

julia> DataFrame(jsontable(objecttable(df))) # objecttable gives you a different layout of data
2×2 DataFrame
│ Row │ a     │ b                │
│     │ Int64 │ Array…           │
├─────┼───────┼──────────────────┤
│ 1   │ 1     │ [[1,8]] │

我在这里展示了如何将其存储在String中并读回,但是您可以改用IO

回读不会恢复元组,但会恢复结构。

现在-这只是一个选择。本教程中对DataFrames.jl的不同加载/保存选项进行了比较:https://github.com/bkamins/Julia-DataFrames-Tutorial/blob/master/04_loadsave.ipynb


现在可以使用CSV了:

julia> CSV.write("tmp.csv",df)
"tmp.csv"

julia> df2 = CSV.File("tmp.csv") |> DataFrame
2×2 DataFrame
│ Row │ a     │ b                │
│     │ Int64 │ String           │
├─────┼───────┼──────────────────┤
│ 1   │ 1     │ [(1,8)] │

julia> df2.b = eval.(Meta.parse.(df2.b))
2-element Array{Array{Tuple{Int64,Int64},1},1}:
 [(1,4)]
 [(5,8)]

julia> df2
2×2 DataFrame
│ Row │ a     │ b                │
│     │ Int64 │ Array…           │
├─────┼───────┼──────────────────┤
│ 1   │ 1     │ [(1,8)] │

但这不是安全的方法。在eval中,可以注入任何不安全的代码来执行。

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...