解析和推广用于重命名变量的Stata程序

问题描述

我第一次学习如何在Stata中编写程序,并且难以概括我的程序,因此在重命名数据集中的变量时可以解析任意变量列表。

我正在处理两个数据集。第一个是面板数据集,其中包含在26年的调查中受访者的生活满意度(与我之前的问题相同)。变量最初以以下格式命名:ap6801 bp9301 cp9601,一直到zp15701ap6801包含受访者对1985年的生活满意度,bp9301包含对1986年的生活满意度,依此类推。

我编写了以下程序来重命名变量,因此它不是ap6801而是lsat1985

program myprogram 
local mcode 1984
foreach stub in a b c d e f g h i j k l m n o p q r s t u v w x y z {
    local mcode = `mcode' + 1
    rename `stub'* lsat`mcode'
}

现在,我想修改和推广该程序,以便可以在第二个数据集上使用任意编号使用它。第二个数据集一直由变量abetto bbetto cbetto组成,直到zbetto。这些变量指示在特定年份是否曾采访过特定人员,如果没有,原因为何。 abetto对应1985年,bbetto对应1986年,依此类推。

我的目标是编写程序的通用版本,以便在我输入变量和其他信息的任意列表(例如lsat和数字列表(例如:1985-2010))时: myprogram ap6801-zp15701,变量将重命名为lsat1985 lsat1986 ... lsat2010

我猜该程序将具有以下基本结构:

program myprogram
syntax varlist
foreach x of varlist {
}

在循环中,可能会有local letter = substr("`x'",1,1)来标识变量的首字母(a,b,c,d ...)。下一步是将字母与用户指定的数字链接,然后执行rename命令,将变量重命名为以下格式: lsat / betto year 。我很难将所有内容都整合到代码中。

我不熟悉Stata和编程,因此对您的帮助表示感谢!

解决方法

您的程序仅在您的特殊情况下有效。 (通常,没有end语句。)如果没有任何通配符a* b* 等在数据中作为相应的变量名出现,它将失败。反之,每个rename从通配符a*到一个变量名lsat1985,只有在每种情况下仅存在一个变量时,这才起作用

更一般而言,这是一个过早编程的示例。偏见警报:为此类高度特定的任务,在特定的变量名前缀中进行接线以及在此类异常情况下编写程序并不是一种好的样式。最多,这是do文件中代码的区域。但是,如果允许使用变量名缩写,则应该可以使用。这里的好作风意味着要解释情况。

* each wildcard a* b* ... is matched by a single variable
set varabbrev on 
local mcode = 1985 
foreach pre in `c(alpha)' { 
    rename `pre' lsat`mcode'
    local ++mcode 
} 

请注意,无需键入所有小写字母az。斯塔塔将所有这些作为c(alpha)放在一处。您不应该知道这一点。为了完整起见,这可能与您的问题无关,请注意,Stata变量名称可以以其他字符开头,尤其是下划线_。我不知道有关2011年以来多年的数据。

如果不冒着令人讨厌的光顾的风险,就很难不写这个。而且评论似乎完全不公平,因为您的目标恰恰是对该程序进行概括的目的!但是,在Stata中,通常是一个更好的主意,那就是,当且仅当您在如此多种不同的情况下使用了do文件时,才需要先编写do文件并移至程序,以至于需要更通用的程序。因此,我不会在更通用的程序上回答您的问题。这显然不是一个好主意,即使是局外人也很难知道该程序的外观。您提供了一个示例,其中后缀看起来不可预测(6801 9301 9601,依此类推),而另一个后缀看起来可预测(betto),我们不知道还有什么是正确的(除非怪异的人认识到您的数据集)。为数据集编写的程序只有26个变量az是可能的,但是您会使用它多次吗?

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...