文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

python数据分析之怎么用pandas搞定Excel表格

2023-06-30 14:05

关注

本篇内容主要讲解“python数据分析之怎么用pandas搞定Excel表格”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“python数据分析之怎么用pandas搞定Excel表格”吧!

python数据分析之怎么用pandas搞定Excel表格

(一)读取其他文件

接下来我们读取三类文件csvtsvtxt文件,值得注意的是读取这三类文件时使用的都是同一个方法,即pd.read_csv(file),在读取时为excel表时需注意分隔符,使用参数sep=''来分隔。接下来我们一起看看在excel和pandas种如何操作的吧!

1.excel读取其他文件

从excel中导入外部数据
python数据分析之怎么用pandas搞定Excel表格

1.1 导入csv文件

导入csv文件时,分隔符选择逗号即可。

python数据分析之怎么用pandas搞定Excel表格

1.2 导入tsv文件

导入tsv文件,分隔符选择tab键

python数据分析之怎么用pandas搞定Excel表格

1.3 导入txt文本文件

导入txt文件时,注意文本里是以什么符号分隔的,自定义分隔符。

python数据分析之怎么用pandas搞定Excel表格

2.pandas读取其他文件

在pandas中为无论是读取csv文件还是tsv文件亦或者txt文件,都是用read_csv()的方法读取,另外加上sep()参数来分隔。

2.1 读取csv文件

import pandas as pd# 导入csv文件test1 = pd.read_csv('./excel/test12.csv',index_col="ID")df1 = pd.DataFrame(test1)print(df1)

2.2 读取tsv文件

tab键用\t来表示

import pandas as pd# 导入tsv文件test3 = pd.read_csv("./excel/test11.tsv",sep='\t')df3 = pd.DataFrame(test3)print(df3)

2.3 读取txt文件

import pandas as pd# 导入txt文件test2 = pd.read_csv("./excel/test13.txt",sep='|')df2 = pd.DataFrame(test2)print(df2)

结果:
python数据分析之怎么用pandas搞定Excel表格

(二)数据透视表

在excel中存在多种数据,且分为很多类型,这时使用数据透视表就会很方便也很直观的为我们分析出各种我们想要的数据了。
实例:将下列数据绘制成一个透视表,并绘制出按总类分每年的销售额! python数据分析之怎么用pandas搞定Excel表格

1.在excel中制作透视表

需要按照年份来分,则我们需要将date列拆分,把年份拆分出来。随后在数据栏下选择数据透视表,选择区域即可。
python数据分析之怎么用pandas搞定Excel表格
随后将各部分数据拖动到各区域即可。
python数据分析之怎么用pandas搞定Excel表格

结果:
python数据分析之怎么用pandas搞定Excel表格

这样就在excel中完成了数据透视表的制作。

那么在pandas中要怎么实现这一效果呢?

2.在pandas中绘制透视表

绘制透视表的函数为:df.pivot_lable(index,columns,values),最后将数据求和即可。

import pandas as pdimport numpy as nppd.options.display.max_columns =999test = pd.read_excel('./excel/test14.xlsx')df = pd.DataFrame(test)# 将年份取出并新建一个列名为年份的列df['year'] = pd.DatetimeIndex(df['Date']).year# 绘制透视表table = df.pivot_table(index='总类',columns='year',values='销售额',aggfunc=np.sum)df1 = pd.DataFrame(table)df1['总计'] = df1[[2011,2012,2013,2014]].sum(axis=1)print(df1)

结果:
python数据分析之怎么用pandas搞定Excel表格

除此之外还可以利用groupby函数来绘制数据表。这里将总类和年份分组求销售总额和销售数量。

import pandas as pdimport numpy as nppd.options.display.max_columns =999test = pd.read_excel('./excel/test14.xlsx')df = pd.DataFrame(test)# 将年份取出并新建一个列名为年份的列df['year'] = pd.DatetimeIndex(df['Date']).year# groupby方法group = df.groupby(['总类','year'])s= group['销售额'].sum()c = group['ID'].count()table = pd.DataFrame({'sum':s,'total':c})print(table)

结果:
python数据分析之怎么用pandas搞定Excel表格

到此,相信大家对“python数据分析之怎么用pandas搞定Excel表格”有了更深的了解,不妨来实际操作一番吧!这里是编程网网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯