文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

Python入门案例之找出文件中出现次数最多的10个单词

2023-02-01 09:00

关注

最近有点需求,在看python的入门基础,看完入门基础之后,跟着练习,找到文件中出现次数最多的10个单词,以此熟悉语法。

语法概要

mac电脑命令行输入python3,回车可以执行语句,exit()退出 python3 xx.py可以执行文件。

代码

# 本文件是获取 任意文件里出现次数前10的word
# 借此学习python的简单数据结构
# python3 xx.py 执行就可以
filename = input('文件的路径:')
# 这里用户输入的文件路径可能打不开,所以try下,如果出错,程序退出
try:
  # 打开文件,获取文件手柄
  handle = open(filename)
except:
  print('File Cannot be opened',filename)
  quit()

countDict = dict()
# 遍历文件的每行,line就是每行的字符串
for line in handle:
  # 空格为分隔符,得到每行的单词列表
  words = line.split()
  # 遍历每行的单词列表,word是每个单词
  for word in words:
    # 此行相当于,没有key的话,新建key取0,有的话返回
    countDict[word] = countDict.get(word,0) + 1
    # 等同于
    # # word没出现在dic的话,需要赋值,不然读的话会报错
    # if word not in countDict :
    #   countDict[word] = 0
    # # 处理完之后,都加1
    # countDict[word] = countDict[word] + 1
# 得到各单词出现的次数字典
# print(countDict)

# 最大出现的次数
bigCount = None
# 最大出现的次数对应的word
bigKey = None
# 遍历字典,key就是word,value就是次数
for word in countDict:
  count = countDict[word]
  # 注意None的情况和大于的情况都需要赋值
  if bigCount is None or count>bigCount:
      bigCount = count
      bigKey = word
# print(bigCount)
# print(bigKey)

# python的字典key必须是字符串包裹
# a = dict({'a':1,'b':2})
# items字典会返回元组列表 [('a', 1), ('b', 2)]
# print(a.items())


# sorted排序元组列表
# 将countDict变成元组列表,然后将k,v对调,变成新元组列表
sortList = sorted(([(count,word) for (word,count) in countDict.items()]),reverse=True)
# 等同于以下
# # 装(value,key)的list
# tempList = list()
# # 遍历countDict.items(),能同时获取key,value
# for (word,count) in countDict.items():
#   # key value调换下位置
#   newTuple = (count,word)
#   # 装进tempList
#   tempList.append(newTuple)
# # sorted 排序元组的时候,先按照元组的第一项排序,这边就是按照count排序,且从大到小
# sortList = sorted(tempList,reverse=True)
# 取前10
tenList = sortList[0:10]

# 还需要将key和value反转回来
resDict = dict()
for (count,word) in tenList:
  resDict[word] = count

print(resDict)

到此这篇关于Python入门案例之找出文件中出现次数最多的10个单词的文章就介绍到这了,更多相关Python找出文件出现次数最多单词内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯