这篇文章将为大家详细讲解有关R语言怎么将大型Excel文件转为dta格式详解,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
本文以2000年度我国工业企业数据库为例,该文件后缀名为xlsx,包含约16万条记录,文件有88M这么大。直接使用Excel打开都费劲:等待时间久,电脑风扇呼呼呼作响。如果尝试用Stata打开该xlsx文件,则会出现提示报错。
报错原因在于,Stata无法读取超过40M的Excel文件。
这就好比瓜迪奥拉的传控足球固然美丽,但是面对摆大巴的球队无能为力。
破大巴需要攻城锤,这把锤子的名字就是R语言。万事开头难啊,正憧憬着数据清洗和花式选取变量建模呢,可不能连数据们长啥模样都没见着啊。R语言适时挺身而出,帮助Stata叩开大型Excel文件之门。
在RStudio中运行如下代码,过程较为浅显,首先引入两个R包,然后输入xlsx后缀名文件,最后便可输出dta后缀名文件。等待2分钟,谁让文件那么庞大呢,接下来便是见证奇迹的时刻。
library(openxlsx)library(foreign)x = read.xlsx('2000.xlsx',1) # 读取 Excel 的 Sheet1# View(x)write.dta(x, '2000.dta') # 输出为 Stata 能读取的格式
在Stata中打开该文件,屏幕会显示这份文件是在R中转化而来。
关于“R语言怎么将大型Excel文件转为dta格式详解”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。