由于最近在处理一些真实数据时涉及到嵌套的 .tar.gz
文件的解压,手动一个一个解压过于麻烦。可以使用 shell 脚本或者 bat 脚本来做,但想尝试使用 R 语言对其进行完全解压,这里就需要涉及到对文件与文件夹的一些操作。
网上已经有许多现有教程,这里参考了很多网上的代码,不过会尝试尽量写得更加详细。
整篇文章我们的测试目录结构如下(生成目录结构树,可以直接在当前路径下打开命令行窗口,输入:tree /f
或 tree /F
):
Blog
│ file1.txt
│ file2.txt
│ file3.txt
│ file4.tar.gz
│
├─dir1
│ file1.txt
│ file2.txt
│
└─dir2
file1.tar.gz
1. 文件与文件夹列表的读取
在进行这些操作之前,首先我们使用 getwd()
可以查看默认文件路径,接着用 setwd(path0)
修改文件默认路径,path0
为设定的路径,在此例子中,设为 Blog 文件夹。
- 获取当前路径下的所有文件:
list.files()
- 获取当前路径下的所有文件夹:
list.dirs()
我们通过下图可以看到两者的区别,.
通常代表当前路径:
如果我们想要获得所有文件夹下面的所有文件,需要怎么做呢?
其实很简单,只需要修改 list.files()
里面的 recursive = TRUE
即可,具体如下所示:
2. 新建文件与文件夹
新建文件:file.create()
新建文件夹:dir.create()
3. 文件与文件夹的删除
删除文件:file.remove()
删除文件夹:dir.remove()
4. 查看文件与文件夹是否存在
查看文件是否存在:file.exists()
查看文件夹是否存在:dir.exists()
小练习
有兴趣的同学可以尝试批量解压:EEG Database Data Set 完全数据集的所有压缩文件。
后面也会写一篇小博客来聊聊如何用 R 语言来进行各种文件的解压。
以上就是R语言操作文件方法详解教程的详细内容,更多关于R语言操作文件的资料请关注编程网其它相关文章!