Pandas 实现分组计数且不计重复-编程学习网

在对dataframe进行分析的时候会遇到需要分组计数，计数的column中属性有重复，但又需要仅对不重复的项计数（即重复N次出现的项只计1次）。

函数如下：

dataframe.groupby([‘分组的列名']).需要计数的列名.nunique()

举例：

数组“data”如下：

StoreID	Sales	SalesDate	Channel
A	100	2018/1/1	01
A	90	2018/1/1	02
A	110	2018/1/2	01
B	82.2	2018/1/1	01
B	90	2018/1/2	02

如果要按StoreID来统计每一家店的营业日期数（可以通过不计重复的count “SalesDate”来完成）

代码如下：


data.groupby(['StoreID']).SalesDate.nunique()

补充：pandas 统计分组内不重复计数

在数据分析中的数据处理过程中，经常需要对数据进行分组计数，看下下面这组数据

数据中name 为C 的有三行，其中有2个code是重复的

目标：

按name 分组，统计每组中code的不重复数量


df.groupby('name')['code'].nunique()
# 以name 分组后，统计code的不重复数目

结果如下：

排序


df.groupby('name')['code'].nunique().sort_values(ascending=False)
# 以name 分组后，统计code的不重复数目

以上为个人经验，希望能给大家一个参考，也希望大家多多支持编程网。如有错误或未考虑完全的地方，望不吝赐教。

文章详情

Pandas 实现分组计数且不计重复

举例：

目标：

排序

软考中级精品资料免费领

相关文章

猜你喜欢

Pandas 实现分组计数且不计重复

Pandas实现groupby分组统计的实践

使用Pandas怎么实现一个分组计数功能

python中pandas对多列进行分组统计的实现

一条sql实现统计总数、分组分别统计总数

JavaScript 中怎么实现数组去重并统计重复元素出现的次数

SQL分组怎么实现去重且合并相似数据

java8 如何实现分组计算数量和计算总数

java8怎么实现分组计算数量和计算总数

Python代码实现列表分组计数

R语言实现两表连接且输出不重复数据

Python Pandas模块实现数据的统计分析的方法

批处理统计词频实现代码(统计重复行的数量/每行重复出现的次数)

Python代码然后实现列表分组计数

R语言实现data.frame 分组计数、求和等

怎么在R语言中实现两表连接且输出不重复数据

两种方法实现mysql分组计数，范围汇总

如何实现统计重复次数并排序的批处理

sql server中怎么使用over()函数实现分组统计

Curator实现分布式锁（可重入不可重入读写联锁信号量栅栏计数器）

文章详情

Pandas 实现分组计数且不计重复

举例：

目标：

排序

软考中级精品资料免费领

相关文章

猜你喜欢

Pandas 实现分组计数且不计重复

Pandas实现groupby分组统计的实践

使用Pandas怎么实现一个分组计数功能

python中pandas对多列进行分组统计的实现

一条sql实现统计总数、分组分别统计总数

JavaScript 中怎么实现数组去重并统计重复元素出现的次数

SQL分组怎么实现去重且合并相似数据

java8 如何实现分组计算数量和计算总数

java8怎么实现分组计算数量和计算总数

Python代码实现列表分组计数

R语言 实现两表连接且输出不重复数据

Python Pandas模块实现数据的统计分析的方法

批处理统计词频实现代码(统计重复行的数量/每行重复出现的次数)

Python代码然后实现列表分组计数

R语言 实现data.frame 分组计数、求和等

怎么在R语言中实现两表连接且输出不重复数据

两种方法实现mysql分组计数，范围汇总

如何实现统计重复次数并排序的批处理

sql server中怎么使用over()函数实现分组统计

Curator实现分布式锁（可重入 不可重入 读写 联锁 信号量 栅栏 计数器）

R语言实现两表连接且输出不重复数据

R语言实现data.frame 分组计数、求和等

Curator实现分布式锁（可重入不可重入读写联锁信号量栅栏计数器）