pandas分组排序如何获取第二大的数据-编程学习网

Python用来做数据分析很方便，网上很多关于找数据中第二大的方法，但是大多数都是关于SQL的，于是我挑战一下用Python来做这件事（主要是SQL写的不好>_<）,上代码。

1、数据我是自己编的

在实际工作中应该从数据库中导入数据，如何从数据库导出数据，我之后会补充。


import pandas as pd
df = pd.DataFrame([
    {"class": 1, "name": "aa", "english": 120},
    {"class": 1, "name": "bb", "english": 110},
    {"class": 1, "name": "cc", "english": 110},
    {"class": 1, "name": "dd", "english": 110},
    {"class": 2, "name": "ee", "english": 120},
    {"class": 2, "name": "ff", "english": 140},
    {"class": 2, "name": "gg", "english": 130},
    {"class": 2, "name": "hh", "english": 130},
    {"class": 3, "name": "tt", "english": 130},
    {"class": 4, "name": "xx", "english": 130},
    {"class": 4, "name": "yy", "english": 130},
    {"class": 5, "name": "zz", "english": None},
  ])

2、分组取第二大的数据


def fun(df):
  # english数据去重
  sort_set = set(df["english"].values.tolist())
  if len(sort_set)<=1:
    # 数据量小于等于1，无法取到第二大的数据
    return None
  else:
    # 取english中第二大的值
    sort_value = sorted(sort_set,reverse=True)[1]
    temp_df = df[df["english"]==sort_value]
    return temp_df
 
df = df.groupby(by=["class"]).apply(fun).reset_index(drop=True)
print(df)

结果如下：


  class name english
0 1 bb 110.0
1 1 cc 110.0
2 1 dd 110.0
3 2 gg 130.0
4 2 hh 130.0

3、写完啦，就这么简单

当然这还可以改为取最大、取最小、取第三大、等等......

补充：pandas 按某一列A排序，按B和C两列分组，选择分组后A列值最大的行

pandas 按某一列A排序，按B和C两列分组，选择分组后A列值最大的行

一、需求

按 updateTime 列倒序排序，按 B 和 C 两列分组，分组后选择最后更新的时间的那一行，并将结果加上新索引。

二、代码


import pandas as pd
data = pd.read_csv('test.csv')
df = pd.DataFrame(data)
df = df.sort_values('updateTime', ascending=False).groupby(['B','C']).first().reset_index()

first() 函数代表选择第一行，如果要选取多行，可以使用 head() 函数： head(5)表示选择前五行。

如下例：


import pandas as pd 
data = pd.read_csv('test.csv',header = 0)
df = pd.DataFrame(data) 
# 按日期分组，分组后对 value 列从大到小排序，取每组前十行
df = df.groupby('date', group_keys=False).apply(lambda x: x.sort_values('value', ascending=False)).groupby('date').head(10).reset_index()

在不能直接使用sort_values() 函数时，使用 apply() 函数。

以上为个人经验，希望能给大家一个参考，也希望大家多多支持编程网。如有错误或未考虑完全的地方，望不吝赐教。

文章详情

pandas分组排序如何获取第二大的数据

1、数据我是自己编的

2、分组取第二大的数据

3、写完啦，就这么简单

一、需求

二、代码

如下例：

软考中级精品资料免费领

相关文章

猜你喜欢

pandas分组排序如何获取第二大的数据

mysql分组排序取组内第一的数据行获取分组后，组内排名第一或最后的数据行。

oracle数据库排序后如何获取第一条数据

oracle如何根据字段分组排序取其第一条数据

MySQL分组排序取每组第一条数据的实现

pyodps中的apply用法及groupby取分组排序第一条数据

MySQL数据库如何生成分组排序的序号

三大数据库如何获取表中的第m条到第n条记录（n大于m）

如何使用Python的pandas库获取DataFrame数据的最小值、最大值以及自定义分位数？

小程序如何获取第三方平台自定义的数据字段

【MySQL】如何在MySQL中获取表中的某个字段为最大值和倒数第二条的整条数据？

Java如何用“自然排序”算法对数组进行不区分大小写字母的排序

PHP如何用“自然排序”算法对数组进行不区分大小写字母的排序

PHP如何用“自然排序”算法对数组进行不区分大小写字母的排序

微信小程序如何获取第三方平台自定义的数据字段

如何通过索引优化PHP与MySQL的数据排序和数据分组的效率？

小程序如何获取第三方平台自定义数据字段的同步接口

文章详情

pandas分组排序 如何获取第二大的数据

1、数据我是自己编的

2、分组取第二大的数据

3、写完啦，就这么简单

一、需求

二、代码

如下例：

软考中级精品资料免费领

相关文章

猜你喜欢

pandas分组排序 如何获取第二大的数据

mysql分组排序取组内第一的数据行获取分组后，组内排名第一或最后的数据行。

oracle数据库排序后如何获取第一条数据

oracle如何根据字段分组排序取其第一条数据

MySQL分组排序取每组第一条数据的实现

pyodps中的apply用法及groupby取分组排序第一条数据

MySQL数据库如何生成分组排序的序号

三大数据库如何获取表中的第m条到第n条记录（n大于m）

如何使用Python的pandas库获取DataFrame数据的最小值、最大值以及自定义分位数？

小程序如何获取第三方平台自定义的数据字段

【MySQL】 如何在MySQL中获取表中的某个字段为最大值和倒数第二条的整条数据？

Java如何用“自然排序”算法对数组进行不区分大小写字母的排序

PHP如何用“自然排序”算法对数组进行不区分大小写字母的排序

PHP如何用“自然排序”算法对数组进行不区分大小写字母的排序

微信小程序如何获取第三方平台自定义的数据字段

如何通过索引优化PHP与MySQL的数据排序和数据分组的效率？

小程序如何获取第三方平台自定义数据字段的同步接口

pandas分组排序如何获取第二大的数据

pandas分组排序如何获取第二大的数据

【MySQL】如何在MySQL中获取表中的某个字段为最大值和倒数第二条的整条数据？