如何使用Stata读取json和csv数据,使其可以像sav文件一样处理

问题描述

我有 json 和 csv 格式的数据,有时需要将其提供给外部分析师。不过,他们习惯于使用 sav 文件,所以我想给他们一些实用功能,使他们能够加载数据并以与使用表单相同的方式处理数据一个 sav 文件。

我熟悉 python,但我可以访问 Stata 来尝试一些东西(但我从未打开过它)。

用于此目的的数据示例如下:

import pandas as pd
import numpy as np

variable_value_labels = {
    "col_a": {
        1: "first thing",2: "something second",3: "meaning of three",},"col_b": {
        1: "No",2: "Yes",}

column_names_to_labels = {
    "col_a": "this is a column here","col_b": "and another","col_c": "this is a column without variable value labels",}

N = 10

df = pd.DataFrame(
    {
        "col_a": np.random.choice(list(variable_value_labels["col_a"].keys()),N),"col_b": np.random.choice(list(variable_value_labels["col_b"].keys()),"col_c": np.random.rand(N),}
)

以上的原始数据是:

用于标记 json 的列名:

{"col_a": "this is a column here","col_c": "this is a column without variable value labels"}

变量值标签json:

{"col_a": {"1": "first thing","2": "something second","3": "meaning of three"},"col_b": {"1": "No","2": "Yes"}}

数据框 csv:

col_a,col_b,col_c
1,1,0.8360787635373775
2,0.3373961604172684
1,2,0.6481718720511972
2,0.36824153984054797
2,0.9571551589530464
3,0.14035078041264515
1,0.8700872583584364
3,0.4736080452737105
1,0.8009107519796442
1,0.5204774795512048

我想要的是一些功能/过程,可以实现诸如:

function( dataframe_path,variable_value_labels_path,column_names_to_labels_path ):
    return <sav file with above info>

如果可以将路径传递给包含这些数据的目录,那也很好。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...