文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

盘点Python中四种读取Json文件和提取Json文件内容的方法

2024-12-02 14:58

关注

大家好,我是Python进阶者。

前言

前几天在才哥的交流群有个叫【杭州-学生-飞飞飞】的粉丝在群里问了一个json文件处理的问题。

看上去他只需要follower和ddate这两个字段下的对应的值。

我们知道json是一种常见的数据传输形式,所以对于爬取数据的数据解析,json的相关操作是比较重要的,能够加快我们的数据提取效率。

思路

关于这个问题,倒不是很难,群里提出了三个方法,第一个是才哥说的pd处理或者正则表达式,第二个是小编自己提出的json处理,第三个是【成都-IT技术支持-小王】提出的jsonpath,总之方法很多,这里给出4个处理方法,希望下次粉丝们再遇到类似问题的时候,有章可循。

实现过程

1、正则表达式

这个方法可以看看,通过匹配的方法进行提取,代码如下所示:

  1. import re 
  2. import json 
  3.  
  4. file = open('漫画.txt''r', encoding='utf-8'
  5. content = file.readline() 
  6. ddate_result1 = re.findall('"ddate":"(\d+\-\d+\-\d+)"', content) 
  7. ddate_result2 = re.findall('"ddate":"(.*?)"', content) 
  8. follower_result1 = re.findall('"follower":(\d+),"', content) 
  9.  
  10. print(ddate_result1) 
  11. print(ddate_result2) 
  12. print(follower_result1) 

运行之后,可以得到结果:

关于ddate,follower获取的方法肯定还有很多其他写法,这里只是抛砖引玉,欢迎大家多多尝试。

2、jsonpath方法一

关于jsonpath的用法,之前在这篇文章中有提及,感兴趣的小伙伴也可以去看看:数据提取之JSON与JsonPATH。

下面是【成都-IT技术支持-小王】大佬给的代码:

  1. from jsonpath import jsonpath 
  2. import json 
  3.  
  4. """follower和ddate""" 
  5. with open("漫画.txt", encoding="utf-8"as file: 
  6.     file_json = json.loads(file.readline()) 
  7.  
  8. follower = jsonpath(file_json, "$..follower"
  9. ddate = jsonpath(file_json, "$..ddate"
  10. print(follower) 
  11. print(ddate) 

代码运行之后,就会得到想要的数据,如下图所示:

这个..就和xpath里面的//一样,子孙节点,$是根节点。

3、jsonpath方法二

这个是另外一个用法了,小号【皮皮】提供的,直接上代码。

  1. import json 
  2. import jsonpath 
  3.  
  4.  
  5. # obj = json.load(open('罗翔.json''r', encoding='utf-8'))  # 注意,这里是文件的形式,不能直接放一个文件名的字符串 
  6. file = open('漫画.txt''r', encoding='utf-8')  # 注意,这里是文件的形式,不能直接放一个文件名的字符串 
  7. obj = json.loads(file.readline()) 
  8. follower = jsonpath.jsonpath(obj, '$..follower')  # 文件对象   jsonpath语法 
  9.  
  10. ddate = jsonpath.jsonpath(obj, '$..ddate')  # 文件对象   jsonpath语法 
  11. print(follower) 
  12. print(ddate) 

代码运行之后,也可以得到预期的结果。

当然了,如果你的文件本来就是json文件,也可以直接读取,代码类似:

  1. import json 
  2. import jsonpath 
  3.  
  4.  
  5. obj = json.load(open('罗翔.json''r', encoding='utf-8'))  # 注意,这里是文件的形式,不能直接放一个文件名的字符串 
  6. # file = open('罗翔.json''r', encoding='utf-8')  # 注意,这里是文件的形式,不能直接放一个文件名的字符串 
  7. # obj = json.loads(file.readline()) 
  8. follower = jsonpath.jsonpath(obj, '$..follower')  # 文件对象   jsonpath语法 
  9.  
  10. ddate = jsonpath.jsonpath(obj, '$..ddate')  # 文件对象   jsonpath语法 
  11. print(follower) 
  12. print(ddate) 

运行之后,也可以得到预期的结果:

4、jsonpath方法三

这个是群里【深圳-Hua Bro】华博提供的,代码如下:

  1. import json 
  2. import jsonpath 
  3.  
  4. with open("罗翔.txt"'r', encoding="UTF-8"as fr: 
  5.     file_json = eval(fr.read().replace('\n\u200b'''))  # 读取的str转为字典 
  6. follower = jsonpath.jsonpath(file_json, '$..follower')  # 文件对象   jsonpath语法 
  7. ddate = jsonpath.jsonpath(file_json, '$..ddate')  # 文件对象   jsonpath语法 
  8. print(follower) 
  9. print(ddate) 

方法大同小异,运行之后,也可以拿到预取的目标数据,如下图所示。

总结

我是Python进阶者。本文基于粉丝针对json文件处理的提问,综合群友们的回答,整理了4种可行的方案,帮助粉丝解决了问题。这里墙裂给大家推荐jsonpath这个库,感兴趣的小伙伴可以学习学习,下次再遇到json文件提取数据就再也不慌啦!

【编辑推荐】

  1. 鸿蒙官方战略合作共建——HarmonyOS技术社区
  2. GitHub标星14K!程序员人手必备的开源备份工具
  3. 终于!Windows 11可直接安装 Android 应用了,傻瓜式教程在这
  4. 微信、支付宝收款码要受限制 都怪这群人洗钱洗得太狠
  5. 网络攻击有多惨,看看微软的“悲惨2021”就知道了!
  6. 微软 Windows 11/Windows 10 Edge 新功能“先买后付”被用户怒批:让浏览器变得臃肿,赶紧停手

 

来源:Python爬虫与数据挖掘内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯