stata处理面板数据及修正命令集合

步骤一:导入数据

原始表如下,

数据请以时间(1998,1999,2000,2001??)为横轴,样本名(北京,天津,河北??)为纵轴

将中文地名替换为数字。

注意:表中不能有中文字符,否则会出现错误。面板数据中不能有空值。

去除年份的一行,将其余部分复制到stata的data editor中,或保存为csv格式。

打开stata,调用数据。

方法一:直接复制到data editor中。

方法二:使用口令:insheet using文件路径

调用例如:insheet using C:\STUDY\paper\taxi.csv

其中csv格式可用excel的“另存为”导出

步骤二:调整格式

首先请将代表样本的var1重命名

口令:rename var1样本名

例如:rename var1province

也可直接在var1处双击,在弹出的窗口中修改:

接下来将数据转化为面板数据的格式

口令:reshape long var,i(样本名)

例如:reshape long var,i(province)

其中var代表的是所有的年份(var2,var3,var4??)

转化成功后继续重命名,其中_j这里代表原始表中的年份,var代表该变量的名称

口令例如:

rename_j year

rename var taxi

也可直接在需要修改的名称处双击,在弹出的窗口中修改

步骤三:排序

口令:sort变量名

例如:sort province year

意思为将province按升序排列,然后再根据排好的province数列排year这一列

最后,保存。

至此,一个变量的前期数据处理就完成了,请如法炮制的处理所有的变量,也就是说每个变量都做一个dta文件。在处理新变量前请使用

口令:clear

将stata重置

步骤四:合并数据

任意打开一个处理过的变量的dta文件作为基础表(推荐使用因变量的dta文件,这里使用

相关推荐
相关主题
热门推荐