这篇文章主要介绍“如何开始入门机器学习”,在日常操作中,相信很多人在如何开始入门机器学习问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”如何开始入门机器学习”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!
为什么选择Python?
在数据科学和机器学习领域最重要的两大程序语言就是 Python 和 R,Python 简洁易学、应用范围广(不限于数据分析)且学习曲线平缓,适合作为第一个入门的程序语言,透过 pandas、SciPy/NumPy、sckikit-learn、matplotlib 和 statsmodels 可以进行数据分析的工作,适合工程任务和需要和网络应用程序整合的项目。至于 R 由于是统计学家开发的程序语言,则是擅长于统计分析、图表绘制,常用于学术研究领域,建议也要有一定程度的掌握。一般情况下 Python 和 R 并非互斥,而是互补,许多数据工程师、科学家往往是在 Python 和 R 两个语言中转换,小量模型验证、统计分析和图表绘制使用R,当要撰写算法和数据库、网络服务互动等情况时在移转到 Python。为了降低学习成本。
此外 Python 本身是一种通用语言,除了数据科学外也可以广泛使用在 网络开发、网站建置、游戏开发、网络爬虫等领域,当你需要整合系统产品服务时,可以担任一站式的开发语言,更重要的是 Python 也可以当成 胶水语言非常轻易和 C/C++ 等效能较佳的语言整合。简而言之,Python 是一种简洁易学但功能强大,值得投资的程序语言,所以我们这边先使用 Python 进行介绍。
若对于 Python 和 R 比较,这边有两篇文章可以参考数据科学界华山论剑:R 与 Python 巅峰对决、Which is better for data analysis:R or Python?。
如何开始入门机器学习?
事实上,数据科学是个跨领域学门,在学习如何使用Python 进行机器学习过程中通常必须掌握以下知识:
机器学习算法
Python 程序语言和资料分析函式库
线性代数 / 统计学等相关学门
专业领域的领域知识( Domain Knowledge )
为了掌握以上三大领域知识(我们先把焦点放在机器学习核心技法,暂时忽略数据科学中对于领域知识的掌握),具体来说我们可以有以下步骤可以参考:
1. 掌握基础Python 程序语言知识
Codecademy
DataCamp(也可以学R)
Learn X in Y Minutes(X = Python)
Learn Python theHard Way
2. 了解基础数学/统计学和机器学习基础知识
可汗学院线性代数
Introto Deive Statistics
Introto Inferential Statistics
Andrew Ng 机器学习课程
Andrew Ng 机器学习笔记
CarnegieMellon University Machine Learning
MachineLearning Foundations (机器学习基石)
3. 知道如何使用Python 科学计算函式库和套件
推荐安装Anaconda,支持跨平台多种版本Python,默认将数据分析、科学计算的套件装好,自带spyder 编辑器、JupyterNotebook(IPythonNotebook),可以提供一个网页版接口,让用户可以透过浏览器进行Julia、Python或R 程序的开发与维护。
numpy:科学分析,ScipyLecture Notes 教学文件
pandas:资料分析
matplotlib:会制图瞟
scikit-learn:机器学习工具
4. 使用scikit-learn 学习Python 机器学习应用
MachineLearning: Python 机器学习:使用Python
5. 运用Python 实作机器学习算法
感知器
判定树
线性回归
k-means分群
6. 实作进阶机器学习算法
SVM
KNN
RandomForests
降低维度
验证模型
7. 了解深度学习(DeepLearning)在Python 的实作和应用
NTU Applied DeepLearning
Stanford DeepLearning
深度学习(Deep Learning)自学素材推荐
到此,关于“如何开始入门机器学习”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注编程网网站,小编会继续努力为大家带来更多实用的文章!