问题描述
我将数据导入到 Stata 中,程序将一些变量作为字符串读取,但不是全部。而且我无法理解我做错了什么,因为某些变量被读取为数字。 Stata有没有办法把字符串转成数字?
解决方法
destring
适用于这种情况,但真正的问题是,当您认为变量应该是数字时,为什么 Stata 将它们读取为字符串。
常见的一些原因是
-
您的数据中包含元数据,特别是如果数据是从在电子表格中花费时间的文件中读取的。标题信息或尾注的行可能会导致此问题。
-
使用了 Stata 无法识别的缺失数据代码,例如
NA
表示缺失。 -
小数点用逗号表示,而不是句号或句号。
destring
的选项通常很重要,因为您可能需要说明应该做什么。因此,请研究 destring
的帮助。
如果一个变量对你来说应该是数字,但不清楚为什么不是,比如
tab myvar if missing(real(myvar))
显示了 myvar
不能轻易转换的值种类。很多时候,很明显存在一个重复的问题,而有一个整体解决方案。