这篇文章给大家分享的是有关Python怎么调用R语言的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。
rpy2是Python调用R程序的模块,旨在方便Python调用R中的相关函数,而不需要先将数据写入txt再传给R来分析,从而可以做到全流程自动化。在pandas 0.18的模块中也添加了rpy2的支持,进而更方便沟通了Python和R的数据流转,构建数据分析的生态系统。
rpy2的安装还是比较麻烦的,试了很多方法,百度了很多网页最终安装成功,做些笔记备忘。
我的安装环境是:
win7_64bit
python3.5_64位,使用的是Anaconda发行版。Anaconda发行版集成了很多Python的有用的数据分析模块,其使用界面和MATLAB很相似,用起来很方便,而且还很方便虚拟出不同版本的Python环境,对那些既想用python2.7,又想用python3.x的同学来说是很好的选择。
R使用的是Revolution R Open 3.2.3_64bit,这是Revolution R现在已经被微软收购了,改为MRO。MRO和CRAN的R没有什么区别,只是改进了多进程并行计算的性能,比原生的R确实有一定的性能提升。当然需要MRO网站上对应的数学计算库Math Library,这个在Revolution R Open的下载界面有。1.下载并安装MRO
1.下载并安装MRO
安装对应的并行数学计算库(可选)。下载地址是:
https://mran.revolutionanalytics.com/download/
2.下载安装Anaconda
下载地址是:
https://www.continuum.io/downloads
3.配置R的环境变量
这是比较重要的一般,很多安装失败的原因就是没有很好配置环境变量。
1. 将R目录添加至path环境变量
path:D:\Program Files\Microsoft\MRO\R-3.2.3\bin\x64;
2. 将R.dll添加至path环境变量
path:D:\Program Files\Microsoft\MRO\R-3.2.3\bin\x64\R.dll;
3. 设置R_HOME环境变量
R_HOME:D:\Program Files\Microsoft\MRO\R-3.2.3
4. 设置R_USER环境变量
R_USER:Administrator
R_USER就是你电脑的用户名,如果没有设置过用户名就是Administrator,可以通过cmd命令行输入net user
查看。
4.下载非官方版本的rpy2
为什么要下载非官方版本的rpy2我也不知道,反正我使用pip install ryp2
没有成功,缺少对应的编译环境,百度出来的网页很多都是说使用非官方版本的rpy2.
下载地址是:http://www.lfd.uci.edu/~gohlke/pythonlibs/ 这是python下包的专用地址
需要下载版本和平台都相对应的whl包,我下的是rpy2-2.9.4-cp36-cp36m-win_amd64.whl,然后使用pip install rpy2-2.9.4-cp36-cp36m-win_amd64.whl
安装即可。
5.python调用R
参考让R与Python共舞和python中调用R
import rpy2.robjects as robjects# 此时,有三种方法调用R对象# 第一种robjects.r['pi']# 第二种robjects.r('pi')# 这种方法从某种程度上讲是万能的,因为可以将任意大小和长度的R代码写成一个python字符串,之后通过robjects.r('Rcode')调用执行第三种robjects.r.pi# 这种方法对于名称中有“点号”的变量会出问题,比如data.frame/read.csv等,所以推荐使用第一种方法
# creat an R functionrobjects.r(''' f <- function(r){pi * r} ''')robjects.r['f'](3)# internal function in Rrobjects.r['ls']()# another internal functionl = robjects.r['letters']len(l)robjects.r['paste'](l, collapse = '-')# an alternative way of getting 'paste' function in R# eval the R codecoder = 'paste(%s, collapse = "-")' % (l.r_repr())robjects.r(coder)
6.pandas调用R
具体参考pandas官方文档–rpy2 / R interface
7.pandas和R的函数对比
具体参考pandas官方文档–Comparison with R / R libraries
列出了实现相同功能的pandas和R的代码,很有启发性。
同时也说明,有想法,用什么工具实现都无所谓,纠结要选python还是R确实是舍本逐末了。如果时间不够,精通其中的一门语言,另一门语言能够掌握简单的使用,也就够了。
以后有事时间再详细写写pandas调用R的部分,以它们之间数据来回传输的原理和注意事项。
我把下载的包放到了d盘的programdata
感谢各位的阅读!关于“Python怎么调用R语言”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!