文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

R语言 data.frame()命令的使用说明

2024-04-02 19:55

关注

同expand.grid() 一样,data.frame() 也是一个生产数据框的命令

不同的是,两者产生的结果,要求不一样

data.frame() 的命令,如


data.frame(x=c(1:4),m=c(10,20,30),n=c(5:16))

  x m n
1 1 10 5
2 2 20 6
3 3 30 7
4 4 10 8
5 1 20 9
6 2 30 10
7 3 10 11
8 4 20 12
9 1 30 13
10 2 10 14
11 3 20 15
12 4 30 16

其中,对于x,m,n所包含的个数是有限制的

具体表现在三者或者更多所包含的个数这些数值【x(4),m(3),n(12)】的最小公倍数为其中一个(最大的那个数)

结果的排列也是不一样的

首先,行数为最多那组含有的数的个数

所有的循环均为依次循环,不像expand.grid()中的后面的还需要先重复之后再循环

补充:R 语言处理excel为data.frame

使用 R包 xlsx 或者 openxlsx

安装


install.packages("xlsx", repos="https://cloud.r-project.org/")
install.packages("openxlsx", repos="https://cloud.r-project.org/")

使用

文件名+sheet的序号读取指定sheet的内容


data <- read.xlsx("Lipstick.xlsx", sheet = 1) # 读取excel
View(data)
## data 为 data.frame
# 读取 table 分隔的文本文件
data = read.table(file.txt, sep="\t", header=T);

访问 data.frame 的元素

查看列名 colnames(data)

查看行名 rownames(data)

提取指定行

data[2,] 提取第二行

提取指定列


data[c("列名1", "列名2", "列名3")] 

data[2] 提取第二列

data[2:4] 提取第2-4列

如果只访问1列,返回的是 vector 类型,可以使用 [[ ]] 或者 $ 来访问 data[[2]] 或者 data$列名

默认情况下,字符串向量会被自动识别成 Factor

向 data.frame 中添加新列 新添加的列的行数要和表中的列的行数相同


data$新列名 <- 数据
data$新列名 <- as.integer(format(Sys.Date(), "%Y")) - as .integer(format(sutdent$birthday, "%Y"))

查询/子集

查询一个data.frame,返回一个满足条件的子集,这相当于数据库中的表查询,是非常常见的操作。

使用行和列的index来获取子集是最简单的方法,详情见前面。

当然也可以使用布尔向量,配合which函数来实现对行的过滤。

比如我们要查询所有Gender为F的数据,那么我们首先通过student$Gender=="F" 得到一个布尔向量:FALSE FALSE ... TRUE,然后使用 which 函数可以将布尔向量中的TRUE的index返回,完整语句如下


student[which(student$Gender=="F")] 

如果我们想知道所有女生的年龄,


student[which(student$Gender=="F"), "Age"]

另外可以直接使用 subset() 函数,比如把查询年龄改为 <30 的女性,查询姓名和年龄,如下


subset(student, Gender=="F" & Age < 30, select=c("Name", "Age"))

使用SQL查询 Data Frame 使用 sqldf 包


library(sqldf)
result <- sqldf("select Name, Age from student where Gender='F' and Age > 30")

连接/合并

对于数据库来说,对多表进行 join 查询是一个很正常的事,在R中也可以对多个 Data.frame 进行连接,需要使用 merge() 函数


result <- merge(student,score,by.x="ID",by.y="SID")

使用 rbind() 函数 rbind 的两个 Data frame 必须有相同的列

以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程网。如有错误或未考虑完全的地方,望不吝赐教。

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯