这篇文章给大家分享的是有关Pandas如何实现分组数据的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。
分组数据
这种操作在数据科学家和分析师的日常生活中经常执行。Pandas
提供了一个基本的函数来执行数据分组,即Groupby
。
Groupby
操作包括根据特定条件拆分对象,应用函数,然后组合结果。
让我们再看一次贷款预测数据集,假设我想看看给来自不同财产领域的人的平均贷款额,比如农村、半城市和城市。花点时间来理解这个问题陈述并思考如何解决它。
嗯,Pandas
的groupby
可以非常有效地解决这个问题。首先根据属性区域划分数据。其次,我们将mean()
函数应用于每个类别。最后,我们将它们组合在一起,并将其打印为新的数据帧。
#导入数据集import pandas as pddf = pd.read_csv('../Data/loan_train.csv')df.head()# 男女平均收入df.groupby(['Gender'])[['ApplicantIncome']].mean()# 平均贷款金额不同的财产地区,如城市,农村df.groupby(['Property_Area'])[['LoanAmount']].mean()# 比较不同教育背景的贷款状况df.groupby(['Education'])[['Loan_Status']].count()
感谢各位的阅读!关于“Pandas如何实现分组数据”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!