文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

2021年机器学习Top 10类库

2024-12-03 00:00

关注

[[417950]]

TensorFlow

TensorFlow 是由谷歌大脑(Google Brain)团队开发的一个AI框架,主要用于深度学习和神经网络。使用TF可以很轻松将计算任务分配到多个CPU或GPU核心,甚至可分配到多GPU。TensorFlow基本计算单元为张量(Tensors)。张量可以定义为一个容器,可存储N维数据及其线性操作。

pandas

Pandas库,主要用于数值数据和时间序列的数据操作。它使用数据框和系列分别定义三维和二维数据。Pandas提供了索引大数据以便在大数据集中快速搜索的选项。它以数据重塑、围绕用户定义的轴旋转、处理缺失数据、合并和连接数据集以及数据过滤选项的功能而闻名。

Pandas对于大型数据集非常有用且速度非常快。当记录超过50k时,其性能超Numpy。在数据清理方面,它是最好的库,因为它提供了像exce一样的交互性和像Numpy一样的速度。它也是为数不多的可以处理DateTime的ML库之一,无需任何外部库的任何帮助,而且代码最少。

Numpy

Numpy用于处理多维数据和复杂的数学函数。Numpy是Python语言的快速计算库,可以处理从基本代数到傅立叶变换、随机模拟和拓扑操作的任务和函数。这个库内核是用C语言编写的,比一般Python计算库性能更好。如果记录数不是很大,在Numpy数组在索引方面要明显优于Pandas系列。另外,目前NumPy数组只支持单CPU中,所以性能会有限制。

Numpy的学习成本较低(可以参考虫虫之前的文章),易于上手,并是最流行的机器学习库之一。

自然语言工具包(NLTK)

是广泛使用的文本分类和自然语言处理库。可以用于词干提取、词形还原、标记和在文档中搜索关键字。NLTK可用于高级语言分析,比如情感、评论分析、文本分类器、检查评论中的关键词、文本挖掘和许多其他与人类语言相关的操作。NLTK需要文本处理来训练的模型来识别和创建。

Scikit-Learn

Scikit-learn主要用于各种数据建模概念,如回归、分类、聚类、模型选择等。 该库是在Numpy、Scipy和matplotlib之上编写的。Scikit-learn易于集成,可以继承其他机器学习库实现特定目标。比如Numpy和Pandas用于数据分析,Plotly用于可视化。

Keras

Keras提供了一个Python接口的 Tensorflow库,特别专注于AI神经网络。早期版本还包括许多其他后端,如Theano、Microsoft认知平台和PlaidMl。Keras 包含常用神经网络的标准块,以及使图像和文本处理更快更流畅的工具。除了标准的神经网络块外,它还提供重复出现的神经网络。

PyTorch

Pytorch 是由脸书开发的ML库,基于Lua语言实现的Torch机器学习库。该项目是用Python、C++ 和CUDA语言混合编写的。PyTorch 支持在C和C++ 以及Pyton等常见语言的扩展。作TF竞争对手,他也使用张量,但它更容易学习并且与Python具有更好集成性。虽然它支持NLP,但该库的主要重点是开发和训练深度学习模型。

mlpack

MlPack 主要是基于C++的机器学习库,支持它Python,R,Julia和 Golang等语言。它旨在支持几乎所有著名的机器学习算法和模型,如 GMM、K均值、最小角度回归、线性回归等。开发该库的主要重点是使其成为快速、可扩展且易于理解的以及易于使用的库,即使是编程小白也可以毫无问题地理解和使用它。

OpenCV

OpenCV 是一个致力于计算机视觉和图像处理的开源平台。 该库拥有2500多种专用于计算机视觉和机器学习的算法。它可以跟踪人体运动、检测移动物体、提取3D模型、将图像拼接在一起以创建高分辨率图像,探索AR的可能性。OpenCV被广泛用于各种闭路电视监控,各大相机厂商也都在使用OpenCV使其产品更智能和用户友好。

Matplotlib

Matplotlib是Pthon中使用最广泛的图形的库。它使用Python GUI工具包来生成图形和绘图。Matplotlib还提供了一个类似MATLAB的界面,以便用户可以执行与MATLAB 类似的任务。这个库是免费和开源的,并且有许多扩展接口,可以将matplotlib API扩展到各种其他库。

总结

在本文中,我们介绍了机器学习中最常用的Python库。每个库(框架)都有自己的优点和缺点,可以尝试使用,并在实践中选择最适合的库。

 

 

来源:虫虫搜奇内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯