python数据处理实例分析-编程学习网

今天小编给大家分享一下python数据处理实例分析的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希望大家阅读完这篇文章后有所收获，下面我们一起来了解一下吧。

一，前言

我们现在拿到了一个十分庞大的数据集。是json文件，里面存储了将近十万个数据，现在要对其中的数据进行清洗处理。

python数据处理实例分析

二，python模块

import jsonimport jieba

我们需要用json模块来处理json文件，和使用jieba库来分析词性，这样可以实现我们的需求。

2.1，增加停用词表

停用词表.txt，把停用词表存入stopwords，原因是：我们的目标分析json里有一些标点符号。

stopwords = [line.strip() for line in open("停用词表.txt",encoding="utf-8").readlines()]

基本如图所示：

python数据处理实例分析

a+str(b)+c这是文件名称，a+b+c=./json/poet.song.0.json b递增，实现动态取值

with open(a+str(b)+c,'r',encoding='utf8')as fp:

因为有将近500个json文件。每个文件里有好几千组数据，我现在尽力的优化代码，现在提取一次，把需要的数据存入文件里面差不多需要五分钟。

2.2，顺序读取

定义一个空的字符串，将json对象转换为python对象。定义一个空的list存放诗句。
循环json_data i为里面的每一个元素。
新的追加到list_paragraphs列表
循环 j为里面的每一句。

代码如图所示：

python数据处理实例分析

使用jieba库，分析str内容的词性【注意是名称，动词。。。。】排行输出都是俩个字是巧合，没有字数限制

words = jieba.lcut(str_s)

现在words为分析完毕的词性列表，遍历。

排除特殊符号

for word in words:            if word not in stopwords:                if len(word) == 1:                    continue                else:                    counts[word] = counts.get(word,0) + 1

出现频率加一。

2.3，lambda函数

使用lambda函数，sort快速排序，遍历输出频率前50的词性。

items.sort(key=lambda x:x[1], reverse=True)

之后赋值word, count。

word, count = items[i]    print ("{:<10}{:>7}".format(word, count))

三，运行

python数据处理实例分析

3.1，存入文件

f=open('towa.txt',"a",encoding='gb18030')            f.writelines("题目:"+textxxx)            f.writelines(word_ping)

python数据处理实例分析

以上就是“python数据处理实例分析”这篇文章的所有内容，感谢各位的阅读！相信大家阅读完这篇文章都有很大的收获，小编每天都会为大家更新不同的知识，如果还想学习更多的知识，请关注编程网行业资讯频道。

文章详情

python数据处理实例分析

一，前言

二，python模块

2.1，增加停用词表

2.2，顺序读取

2.3，lambda函数

三，运行

3.1，存入文件

软考中级精品资料免费领

相关文章

猜你喜欢

python数据处理实例分析

Python Pandas数据处理高频操作实例分析

Python异常处理实例分析

Python函数加速数据分析处理速度的示例分析

Python数据分析matplotlib折线图案例处理

Python数据处理及可视化的示例分析

ajax数据处理的示例分析

Python数据类型实例分析

Spring Boot多数据源处理事务实例分析

Python中的异常处理实例分析

VB.NET处理数据行的示例分析

python数据分析绘图可视化实例分析

【Pandas数据处理100例目录】Python数据分析玩转Excel表格数据

Python数据异常值检测和处理的示例分析

Python中的Selenium异常处理实例分析

python中with和异常处理实例分析

Python异常处理的方法实例分析

Pandas文本数据处理的示例分析

Pytorch中Dataset数据处理的示例分析

Python数据结构的栈实例分析