文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

如何在R语言中使用quantile()函数

2023-06-14 13:30

关注

这期内容当中小编将会给大家带来有关如何在R语言中使用quantile()函数,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。

1、求某个百分位比

> data <- c(1,2,3,4,5,6,7,8,9,10)> quantile(data,0.5)50% 5.5 > quantile(data,c(0.25,0.75)) 25%  75% 3.25 7.75

2、产生一个序列百分位比值

> quantile(data,seq(0.1,1,0.1)) 10%  20%  30%  40%  50%  60%  70%  80%  90% 100%  1.9  2.8  3.7  4.6  5.5  6.4  7.3  8.2  9.1 10.0

3、只取百分号下面的数值

> unname(quantile(data,seq(0.1,1,0.1))) [1]  1.9  2.8  3.7  4.6  5.5  6.4  7.3  8.2  9.1 10.0

补充:基于R语言的分位数回归(quantile regression)

分位数回归(quantile regression)

这一讲,我们谈谈分位数回归的知识,我想大家传统回归都经常见到。分位数回归可能大家见的少一些,其实这个方法也很早了,大概78年代就有了,但是那个时候这个理论还不完善。到2005年的时候,分位数回归的创立者Koenker R写了一本分位数回归的专著,剑桥大学出版社出版的。今年本来老爷子要出一本《handbook of quantile regression》,还没有正式出来呢,目前来看,分位数回归应用的范围非常广。在金融领域尤为重要。下面先给大家简单介绍一下,分位数回归的基本原理,完后拿R做一个完整的案例。为什么拿R软件,因为分位数回归的发明者最早拿R写了一个包,叫quantreag,是当时唯一一个分位数回归的包,现在的话,看到python,julia也有相关的包了。但是感觉这个R的还是最好的。

那么什么是分位数回归呢,这个就要从传统的回归说起,传统回归呢,一般叫最小二乘回归,也叫均值回归。这个均值是指条件均值。比较抽象,在前面有一篇博文中,我比较详细地解释过。那么分位数回归就是均值回归的拓展,也就是它可以拟合均值以外的其它分位点,形成多条回归线,这里首先需要强调的是分位数回归的分位点是指因变量y的分位点,不是x的。这样我们如果设定多个分位点就得到了多条回归直线。当然分位数回归现在也发展出来非线性分位数回归,就是可以拟合出多条曲线,或者和广义线性回归模型一样可以适用二值变量。要说分位数回归具体的原理,后面有空再细谈。下面我们拿R语言做一个案例,大家就可以逐渐感受到分位数回归具体的含义了。

案例所用的数据呢,大家应该都比较熟悉,就是收入和食品消费支出的数据

下面看代码

#导入分位数回归的包library(quantreg)                         # 引入数据data(engel)#查看数据格式mode(engel)[1] "list"#查看变量名names(engel)[1] "income"  "foodexp"#查看格式class(engel)[1] "data.frame"#查看数据的前五行head(engel)income  foodexp1 420.1577 255.83942 541.4117 310.95873 901.1575 485.68004 639.0802 402.99745 750.8756 495.56086 945.7989 633.7978#画个散点图看看数据plot(engel$income, engel$foodexp, xlab='income', ylab='foodexp')

图是这样的

如何在R语言中使用quantile()函数

下面我们继续简单查看一下数据

#查看foodexp的变化范围boxplot(engel$foodexp, xlab='foodexp')#简单验证一下因变量foodexp是否服从正态分布qqnorm(engel$foodexp, main='QQ plot')qqline(engel$foodexp, col='red', lwd=2)

结果如下:

如何在R语言中使用quantile()函数

下面是QQ图

如何在R语言中使用quantile()函数

结果表明,因变量y明显不服从正态分布,但是呢,分位数回归不要求y服从正态分布,不仅如此,而且分位数回归还对异常值点不敏感。

下面我们继续,为了对比,我们仍然做一个均值回归,再做一个分位数回归。

#可以直接调用数据框里变量attach(engel)#设置0.05, 0.25, 0.5, 0.75, 0.95五个分位点,并且进行分位数回归,这样可以得到五条分位数回归线rq_result <- rq(foodexp ~ income, tau=c(0.05, 0.25, 0.5, 0.75, 0.95))summary(rq_result)Call: rq(formula = foodexp ~ income, tau = c(0.05, 0.25, 0.5, 0.75,     0.95))tau: [1] 0.05Coefficients:            coefficients lower bd  upper bd (Intercept) 124.88004     98.30212 130.51695income        0.34336      0.34333   0.38975Call: rq(formula = foodexp ~ income, tau = c(0.05, 0.25, 0.5, 0.75,     0.95))tau: [1] 0.25Coefficients:            coefficients lower bd  upper bd (Intercept)  95.48354     73.78608 120.09847income        0.47410      0.42033   0.49433Call: rq(formula = foodexp ~ income, tau = c(0.05, 0.25, 0.5, 0.75,     0.95))tau: [1] 0.5Coefficients:            coefficients lower bd  upper bd (Intercept)  81.48225     53.25915 114.01156income        0.56018      0.48702   0.60199Call: rq(formula = foodexp ~ income, tau = c(0.05, 0.25, 0.5, 0.75,     0.95))tau: [1] 0.75Coefficients:            coefficients lower bd  upper bd (Intercept)  62.39659     32.74488 107.31362income        0.64401      0.58016   0.69041Call: rq(formula = foodexp ~ income, tau = c(0.05, 0.25, 0.5, 0.75,     0.95))tau: [1] 0.95Coefficients:            coefficients lower bd upper bd(Intercept) 64.10396     46.26495 83.57896income       0.70907      0.67390  0.73444#上面就是没条回归线的回归系数,我们做个图看一下plot(income, foodexp, cex=0.25, type='n', xlab='income', ylab='foodexp')points(income, foodexp, cex=0.5, col='blue')#加中位数数回归的直线abline(rq(foodexp~income, tau=0.5), col='blue')#加均值回归的五条直线abline(lm(foodexp~income), lty=2, col='red')#将分位数回归的五条线加上去taus <- c(0.05, 0.1, 0.25, 0.75, 0.9, 0.95)#for (i in 1:length(taus)){  abline(rq(foodexp~income, tau=taus[i]), col='gray')}

效果如下:

如何在R语言中使用quantile()函数

上述就是小编为大家分享的如何在R语言中使用quantile()函数了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注编程网行业资讯频道。

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯