怎么使用Python+Pandas实现数据透视表-编程学习网

这篇文章主要介绍了怎么使用Python+Pandas实现数据透视表的相关知识，内容详细易懂，操作简单快捷，具有一定借鉴价值，相信大家阅读完这篇怎么使用Python+Pandas实现数据透视表文章都会有所收获，下面我们一起来看看吧。

导入示例数据

首先导入演示的数据集。

import pandas as pddf = pd.read_csv('销售目标.csv')df.head()

怎么使用Python+Pandas实现数据透视表

参数说明

怎么使用Python+Pandas实现数据透视表

主要参数：

data：待操作的 DataFrame
values：被聚合操作的列，可选项
index：行分组键，作为结果 DataFrame 的行索引
columns：列分组键，作为结果 DataFrame 的列索引
aggfunc：聚合函数/函数列表，默认 numpy.mean 这里要注意如果 aggfunc 中存在函数列表，则返回的 DataFrame 中会显示函数名称
fill_value：默认 None，可设定缺省值
dropna：默认 True，如果列的所有值都是 NaN，将被删除；False 则保留
margins：默认 False，设置为 True 可以添加行/列的总计
margins_name：默认显示 'ALL'，当 margins = True 时，可以设定 margins 行/列的名称

常用操作

使用pivot_table时必须要指定index，因为计算时要根据index进行聚合。

pd.pivot_table(df.head(20),               index='订单日期',               aggfunc=np.sum)

怎么使用Python+Pandas实现数据透视表

通过指定value来选择被聚合的列。

pd.pivot_table(df.head(20),               values='销售目标',               index='订单日期',               aggfunc=np.sum)

怎么使用Python+Pandas实现数据透视表

当只指定index进行聚合时，其实用groupby可以实现同样的效果。

df.head(20).groupby(['订单日期'])['销售目标'].sum().reset_index()

添加columns参数，对列分组。

pd.pivot_table(df.head(10),               values='销售目标',               index=['订单日期', '类别'],               columns='细分',               aggfunc=np.sum)

怎么使用Python+Pandas实现数据透视表

对于上面结果中的空值，使用fill_value参数统一填充为0

pd.pivot_table(df.head(10),               values='销售目标',               index=['订单日期', '类别'],               columns=['细分'],               aggfunc=np.sum,               fill_value=0)

怎么使用Python+Pandas实现数据透视表

现在按年份来统计销售数据，注意此时的aggfunc参数，当参数值包含列表时，在结果DataFrame中就会显示函数名称。

pd.pivot_table(df,               values='销售目标',               index=['年份', '类别'],               columns='细分',               aggfunc=[np.sum])

怎么使用Python+Pandas实现数据透视表

如果需要添加合计列，只需指定margins=True即可，同时根据需要指定合计名称。

pd.pivot_table(df,               values='销售目标',               index=['年份', '类别'],               columns='细分',               aggfunc=np.sum,               margins=True,              margins_name='合计')

怎么使用Python+Pandas实现数据透视表

当然与groupby类似，对于计算函数我们可以同时指定多种方式。

pd.pivot_table(df,               values='销售目标',               index=['年份', '类别'],               columns=['细分'],               aggfunc={'销售目标': [max, np.sum]},               fill_value=0)

怎么使用Python+Pandas实现数据透视表

关于“怎么使用Python+Pandas实现数据透视表”这篇文章的内容就介绍到这里，感谢各位的阅读！相信大家对“怎么使用Python+Pandas实现数据透视表”知识都有一定的了解，大家如果还想学习更多知识，欢迎关注编程网行业资讯频道。

文章详情

怎么使用Python+Pandas实现数据透视表

导入示例数据

参数说明

常用操作

软考中级精品资料免费领

相关文章

猜你喜欢

怎么使用Python+Pandas实现数据透视表

Python+Pandas实现数据透视表

SQL、Pandas和Spark：如何实现数据透视表？

Python如何实现数据透视表

Python实现数据透视表详解

Pandas使用stack和pivot实现数据透视的方法

MySQL/MariaDB怎么实现数据透视表

Pandas数据透视的函数如何使用

Python中怎么实现一个透视表

excel数据透视表怎么做

Oracle中如何实现数据透视表

怎么在Python中使用pandas实现数据分析

Excel数据透视表怎么制作

怎么在Python中使用pandas函数实现数据分析

一文搞懂Pandas数据透视的4个函数的使用

Unity怎么实现透视滑动列表

Python中怎么使用使用Plotly实现数据可视化

Java中怎么创建Excel 数据透视表

100天精通Python（数据分析篇）——第66天：Pandas透视表基础+实战案例（pivot_table函数）

使用pandas模块怎么实现数据标准化