链客,专为开发者而生,有问必答!
此文章来自区块链技术社区,未经允许拒绝转载。
数据分析如何入门学习How do I learn data analysis with Python?
虽然是英文的,不过看一遍很大收获(可以用百度翻译看一下)
Numpy使用
快速入门Numpy
Stack Overflow Numpy问题汇集
书籍推荐NumPy Cookbook -第二版 by Ivan Idris(用中文版)
8.3 更新,自己的笔记,凑合看下吧,有些我觉得没太重要的就没记上去(也包括Matplotlib的那一部分)
待续
Pandas使用
入门级神作,没错就是10 Minutes to pandas
进阶级神作,没错就是Stack Overflow Pandas问题汇集——>强烈推荐
Pandas is a Python library for Panel Data manipulation and analysis, e.g. multidimensional time series and cross-sectional data sets commonly found in statistics, experimental science results, econometrics, or finance. IMPORTANT: When asking a question with this tag, please tag your questions: [python]; [pandas]; [dataframe]/[series]; (optional) [groupby]/[merge]/etc., depending on your specific requirements.
Pandas神书Pandas Cookbook
Pandas数据结构之Series:
【pandas】[1] Series 入门(创建和增删改查)
Pandas中兼并数组和字典功能的Series
Series也就是Numpy的一维数组,很多方法是通用的。以上两篇足以掌握。
关键是DateFrame使用
pandas分块处理大文件
drop函数使用————>强烈推荐
Pandas GroupBy对象——>强力推荐,系统的讲了groupby对象创建及一系列函数使用
Pandas合并与重塑
PANDAS 数据合并与重塑(concat篇)
PANDAS 数据合并与重塑(join/merge篇)
isin()函数用于构建布尔对象,便于删选dateframe的行, pandas中isin()函数及其逆函数使用
建议用loc和iloc选择行
loc以行索引和列索引key来选择元素
iloc以行列所在的整数索引来选择元素,不过都从0开始
待续
matplotlib使用
自己的笔记,凑合看下吧,有些我觉得没太重要的就没记上去(也包括Matplotlib的那一部分)
推荐B站上的一个up主的视频,莫烦·Matplotlib中文视频教程——基于python3,看完差不多就OK了