python统计前十出现最多的词-编程学习网

一、描述

这是一道python面试题：

“一个可读文件，有一万行，一行只有一个单词，单词可以重复的，求出这一万行中出现频繁次数最多的前10个单词”

二、思路

先读取文件变为列表，再用集合去重得到一个参照的列表，逆排序取前10（最大即最多的的10个元素），再用参照列表中的每个元素从文件中去统计，把参照列表中的元素作为键，统计到的结果为值，放入字典，打印出来。

三、代码

#!/usr/bin/python
#coding:utf-8
all_C = []
with open("words.txt",'r') as f:
    for line in f.readlines():
        all_C.append(line)
#获取无重复元素
all_set=set(sorted(all_C))
#统计为字典
counts={}
for key in all_set:
     counts[key] = all_C.count(key)
#获取前10个元素的个数变为列表
tens = sorted(counts.values(),reverse=True)[0:11]
print tens
#统计最终前十的元素及出现次数
tendict = {}
for k in counts.keys():
    if counts[k] in tens:
        tendict.setdefault(counts[k],k.strip("\n"))
print("出现最多的10个词为:%s \n") %tendict

#python tens.py

如图：

练习的文件类似如下10001行，以文件的方式读取还是很快的：

参考其他人代码二：

#!/usr/bin/python
#coding:utf-8
result= {}
with open("words.txt",'r') as fopen:
    fopen.seek(0,2)
    all = fopen.tell()
    fopen.seek(0,0)
    while fopen.tell() < all:
        lines = fopen.readline().strip()
        if lines in result:
            result[lines] += 1
        else:
            result[lines] = 1
print(sorted(result.items(),key=lambda k:k[1],reverse=True)[:11])

执行结果如图：

总结：

自己写的有点lower完全是练习，方法二高大上！还有更好的方法吗？

文章详情

python统计前十出现最多的词

软考中级精品资料免费领

相关文章

猜你喜欢

python统计前十出现最多的词

awk脚本统计一组单词中字母出现最多最少频率

Java统计英文句子中出现次数最多的单词并计算出现次数的方法

python中文分词+词频统计的实现步骤

python如何统计字符串每个单词出现的次数

Python入门案例之找出文件中出现次数最多的10个单词

统计numpy数组中最频繁出现的值

awk统计文件中某关键词出现次数的命令

python如何统计在可迭代器中最常出现的元素

教你JavaScript利用charAt()统计出现次数最多的字符和次数

tr命令在统计英文单词出现频率中的妙用

批处理统计词频实现代码(统计重复行的数量/每行重复出现的次数)

python如何找出列表中出现最多次数的元素

Python如何统计字母出现的次数

python怎么统计数字出现的次数

Python中如何找出序列中出现次数最多的元素

python如何求列表中出现次数最多的元素

python如何查找列表中出现次数最多的数字

Python如何统计序列中元素的出现频度

Python怎么统计序列中元素的出现频度