python 如何在list中找Topk的数值和索引-编程学习网

短信预约信息系统项目管理师报名、考试、查分时间动态提醒

需求：

对于一个python list 或者numpy数组，我需要找到这个list中最大的K个数及其对应的下标。

解决方式：

可以构造字典通过排序解决，不过代码量较多。

使用heapq库，可以直接获取最大值的下标和数值。


import heapq
a = [4,2,6,1,9,9]
 
# 获取下标， 输出为[4, 5, 2]
heapq.nlargest(3, range(len(a)), a.__getitem__)
 
# 获取数值， 输出为[9, 9, 6]
heapq.nlargest(3,a)

如果要取最小的数，使用 nsmallest即可

补充：Python 利用中间值求TopK 算法

算法思想

首先我们要思考，我要做什么？解决什么问题？

TopK问题，找出一组数据中的前K个最大值或者最小值，这个数据是否重复？要做去重处理？

ok 我们明确我们做什么了，那介绍的python处理的topK 算法过程是怎么样的呢？

如果用排序那就没必要引入topK 了，当数据强大的时候选取TopK 可以省略很多排序的计算，至于有多优化自己去思考下，就比如排列组合的C，A的区别，一个是抽取，一个是抽取并排列…

以下以找出TopK 的最大值为例，最小值的可以自己修改一下下就可以

介绍的算法思想是利用中间值，将数列分为三部分，

【比中间值大的列表】，中间值，【比中间值小的列表】

那么我们当比较

【比中间值大的列表】的个数 == k

的时候就可以得出前K个最大值了，因此

重点就是找出这个中间值

如何找出中间值

以列表的第一个数开始为中间值，拆分为三部分

if 【比中间值大的列表】的个数 == k：return 中间值 #程序出口，结束。

if 【比中间值大的列表】的个数 < k ：

·····继续在【比中间值小的列表】找

·····K - 【比中间值大的列表】的个数 -1 个数

（为什么要减一，1是前一次的中间值，分的三部分，前部分后部分都没有包含中间值，因此…）

if 【比中间值大的列表】的个数 > k ：

…也就是说比中间值大的列表比K还大，那就在这个列表中继续找就行

结合代码和注释看

如果要找最小值，只需要改一下就ok ,还可以设置一个布尔值的输入，来做前K个最大值最小值


#2019 11 04
#author 半斤地瓜烧
#TopK 算法，找出序列中前K个最大值的
#输入一个seq
# 输出以seq[0]为中间值 划分的三个部分，中间值，比这个值大的seq ,比这个值小的seq，
# 即splitNum,theBig,theSmall
def Split_Seq(seq):
    splitNum = seq[0]
    seq = seq[1:]#两个部分都不包含中间值，因此切片去除seq[0]
    theBig = [x for x in seq if x >= splitNum]
    theSmall = [x for x in seq if x < splitNum]
    return splitNum,theBig,theSmall
#找出中间值
def topKNum(seq,k):
    splitNum, theBig, theSmall = Split_Seq(seq)
    theBigLen = len(theBig)
    
    if  k == theBigLen:
        return splitNum#出口,返回这个中间值,
    # 为什么不直接返回thebig?因为存在递归的原因thebig 不是在初始的seq找出来的
    #需要重新Split,即可，读者自己思考
    # 大值的列表中还未够K个数的情况，
    if k > theBigLen:
        return topKNum(theSmall,k-theBigLen-1)
    # 大值的列表中大于K个数的情况
    return topKNum(theBig,k)
#由中间值找出TopK个值，<list>
def getTopK(seq,k):
    
    return [i for i in seq if i > topKNum(seq, k)]
if __name__ == '__main__':
    alist = [7, 3, 5, 1,885,234,2211,222,22, 2, 11, 2, 115]
    print("===为了验证，引入排序观看===", sorted(alist,reverse= True))
    print(getTopK(alist, 3))

以上为个人经验，希望能给大家一个参考，也希望大家多多支持编程网。

文章详情

python 如何在list中找Topk的数值和索引

需求：

解决方式：

算法思想

以下以找出TopK 的最大值为例，最小值的可以自己修改一下下就可以

重点就是找出这个中间值

如何找出中间值

结合代码和注释看

软考中级精品资料免费领

相关文章

猜你喜欢

python 如何在list中找Topk的数值和索引

如何使用Python在索引中查找特定值？

Bash和Python：如何在二维码中查找特定索引？

JS中如何查找数字在数组中的索引位置

如何在Python中实现二维码的索引和检索？

python如何求列表中最小和最大值的索引

如何在Python中高效地索引NumPy数组？

如何在MySQL中维护索引和数据表

二维码索引：如何在Python和Bash中实现？

python中ndarray数组的索引和切片如何使用

PHP中的数组索引：如何使用路径和numy索引？

MySQL的索引在Python中如何合理创建和使用？（Python环境下如何为MySQL数据库合理创建和使用索引？）

框架索引的Python技巧：如何在Unix环境下快速查找数据

如何在Python中实现高效的文件索引和加载？

如何在 Python 中实现高效的索引和日志处理？

如何在PostgreSQL数据库中创建和使用索引

如何在Python和Bash中使用二维码进行索引？

jQuery如何在无序的set中查找一个元素的索引

如何在PHP中打包NumPy数组的索引？

如何在Java和Laravel中创建强大的索引？