对比其它编程语言,我们都知道Python最大的优势是代码简单,有丰富的第三方开源库供开发者使用。伴随着近几年数据分析的热度,Python也成为最受欢迎的编程语言之一。而对于数据的读取和存储,对于普通人来讲,除了数据库之外,最常见的就是微软的Excel。
1.1初识Excel
Microsoft Excel是Microsoft为使用Windows和Apple Macintosh操作系统的电脑编写的一款电子表格软件。
1.2 格式区别
Excel中有xls和xlsx两种格式,它们之间的区别是:
- 文件格式不同。xls是一个特有的二进制格式,其核心结构是复合文档类型的结构,而xlsx的核心结构是XML类型的结构,采用的是基于 XML的压缩方式,使其占用的空间更小。xlsx 中最后一个 x 的意义就在于此。
- 版本不同。xls是Excel2003及以前版本生成的文件格式,而xlsx是Excel2007及以后版本生成的文件格式。
- 兼容性不同。xlsx格式是向下兼容的,可兼容xls格式。
1.3 库的使用
Python自带的模块中有针对xls格式的xlrd和xlwt模块,但这两个库仅仅是针对xls的操作,当我们要操作xlsx格式文件时,则需要使用到openpyxl第三方库。
1.4 整体思路
当使用以上几个模块的时候,从理论上我们就可以完全操作不同格式的Excel的读和写,很多人就疑惑,那这篇文章的作用是什么?我们直接学习对应的这三个模块不就好了吗?
答案就是:虽然这几个库已经把Excel的文件、表、行、列的概念完全转换为Python中的对象,但每次操作都需要遍历每一个单元格,甚至很多时候我们要花费大量的时间在思考循环单元格的边界上,这本身就是在重复造轮子,因此我花了半天时间整理了以下六个函数。
2.1 xlz格式
2.1.1 读取xls格式文件
def read_xls_excel(url,index): ''' 读取xls格式文件 参数: url:文件路径 index:工作表序号(第几个工作表,传入参数从1开始数) 返回: data:表格中的数据 ''' # 打开指定的工作簿 workbook = xlrd.open_workbook(url) # 获取工作簿中的所有表格 sheets = workbook.sheet_names() # 获取工作簿中所有表格中的的第 index 个表格 worksheet = workbook.sheet_by_name(sheets[index-1]) # 定义列表存储表格数据 data = [] # 遍历每一行数据 for i in range(0, worksheet.nrows): # 定义表格存储每一行数据 da = [] # 遍历每一列数据 for j in range(0, worksheet.ncols): # 将行数据存储到da列表 da.append(worksheet.cell_value(i, j)) # 存储每一行数据 data.append(da) # 返回数据 return data
2.1.2 写入xls格式文件
def write_xls_excel(url,sheet_name,two_dimensional_data): ''' 写入xls格式文件 参数: url:文件路径 sheet_name:表名 two_dimensional_data:将要写入表格的数据(二维列表) ''' # 创建工作簿对象 workbook = xlwt.Workbook() # 创建工作表对象 sheet = workbook.add_sheet(sheet_name) # 遍历每一行数据 for i in range(0,len(two_dimensional_data)): # 遍历每一列数据 for j in range(0,len(two_dimensional_data[i])): # 写入数据 sheet.write(i,j,two_dimensional_data[i][j]) # 保存 workbook.save(url) print("写入成功")
2.1.3 追加写入xls格式文件
def write_xls_excel_add(url, two_dimensional_data, index): ''' 追加写入xls格式文件 参数: url:文件路径 two_dimensional_data:将要写入表格的数据(二维列表) index:指定要追加的表的序号(第几个工作表,传入参数从1开始数) ''' # 打开指定的工作簿 workbook = xlrd.open_workbook(url) # 获取工作簿中的所有表格 sheets = workbook.sheet_names() # 获取指定的表 worksheet = workbook.sheet_by_name(sheets[index-1]) # 获取表格中已存在的数据的行数 rows_old = worksheet.nrows # 将xlrd对象拷贝转化为xlwt对象 new_workbook = copy(workbook) # 获取转化后工作簿中的第index个表格 new_worksheet = new_workbook.get_sheet(index-1) # 遍历每一行数据 for i in range(0, len(two_dimensional_data)): # 遍历每一列数据 for j in range(0, len(two_dimensional_data[i])): # 追加写入数据,注意是从i+rows_old行开始写入 new_worksheet.write(i+rows_old, j, two_dimensional_data[i][j]) # 保存工作簿 new_workbook.save(url) print("追加写入成功")
2.2 xlsx格式
2.2.1 读取xlsx格式文件
def read_xlsx_excel(url, sheet_name): ''' 读取xlsx格式文件 参数: url:文件路径 sheet_name:表名 返回: data:表格中的数据 ''' # 使用openpyxl加载指定路径的Excel文件并得到对应的workbook对象 workbook = openpyxl.load_workbook(url) # 根据指定表名获取表格并得到对应的sheet对象 sheet = workbook[sheet_name] # 定义列表存储表格数据 data = [] # 遍历表格的每一行 for row in sheet.rows: # 定义表格存储每一行数据 da = [] # 从每一行中遍历每一个单元格 for cell in row: # 将行数据存储到da列表 da.append(cell.value) # 存储每一行数据 data.append(da) # 返回数据 return data
2.2.2 写入xlsx格式文件
def write_xlsx_excel(url, sheet_name, two_dimensional_data): ''' 写入xlsx格式文件 参数: url:文件路径 sheet_name:表名 two_dimensional_data:将要写入表格的数据(二维列表) ''' # 创建工作簿对象 workbook = openpyxl.Workbook() # 创建工作表对象 sheet = workbook.active # 设置该工作表的名字 sheet.title = sheet_name # 遍历表格的每一行 for i in range(0, len(two_dimensional_data)): # 遍历表格的每一列 for j in range(0, len(two_dimensional_data[i])): # 写入数据(注意openpyxl的行和列是从1开始的,和我们平时的认知是一样的) sheet.cell(row=i + 1, column=j + 1, value=str(two_dimensional_data[i][j])) # 保存到指定位置 workbook.save(url) print("写入成功")
2.2.3 追加写入xlsx格式文件
def write_xlsx_excel_add(url, sheet_name, two_dimensional_data): ''' 追加写入xlsx格式文件 参数: url:文件路径 sheet_name:表名 two_dimensional_data:将要写入表格的数据(二维列表) ''' # 使用openpyxl加载指定路径的Excel文件并得到对应的workbook对象 workbook = openpyxl.load_workbook(url) # 根据指定表名获取表格并得到对应的sheet对象 sheet = workbook[sheet_name] for tdd in two_dimensional_data: sheet.append(tdd) # 保存到指定位置 workbook.save(url) print("追加写入成功")
希望这篇文章对正在学习Python的你有一定的帮助!
给大家分享一波Python全套学习资料,免费!免费!免费!都是我自己学习时整理的,整理不易,请多多点赞分享哦~
微信扫描下方CSDN官方认证二维码即可领取啦!
一、Python所有方向的学习路线
Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
二、Python学习软件
工欲善其事,必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。
三、Python入门学习视频
我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。
四、Python练习题
检验学习成果
五、Python实战案例
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
六、Python面试资料
我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
需要的小伙伴可自行微信扫描下方CSDN官方认证二维码免费领取!!
来源地址:https://blog.csdn.net/maiya_yaya/article/details/131509384