本篇文章给大家分享的是有关怎么在python中使用pandas合并Sheet,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。
使用python中的pandas,xlrd,openpyxl库完成合并excel中指定sheet的操作
# -*- coding: UTF-8 -*- import xlrdimport pandas as pdfrom pandas import DataFramefrom openpyxl import load_workbook#表格位置excel_name = '1.xlsx'# 获取workbook中所有的表格wb = xlrd.open_workbook(excel_name)#获取sheetssheets = wb.sheet_names()# 循环所需sheetnewdata = DataFrame()#in后()里填写需要合并的sheet页数for i in (3,4,5): df = pd.read_excel(excel_name, sheet_name=(i-1), header = None,index_col=0,encoding='utf-8') newdata = newdata.append(df,ignore_index = False)#保存为新的sheet,首先新建sheet,合并后的数据保存到新sheet中writer = pd.ExcelWriter('1.xlsx',engin='openpyxl')book = load_workbook(writer.path)writer.book = book#利用dataframe.to_excel保存合并后的数据到新的sheet,生成新的sheet命名为newdatanewdata.to_excel(excel_writer=writer,sheet_name="newdata")writer.save()writer.close()print('处理完成!')
其中
df = pd.read_excel(excel_name, sheet_name=(i-1), header = None,index_col=0,encoding='utf-8')
需要指定 header = None,否则会出现如下warning:
FutureWarning: Sorting because non-concatenation axis is not aligned. A future version
of pandas will change to not sort by default.
并且生成的新sheet中的列会出现乱序以及Unnamed列。
补充:pandas 中读取和写入csv文件时候出现Unnamed:0的解决方案
在读取csv文件的时候,默认会自动添加新的一列,Unnamed:0
解决方案:
read_csv()时候,设置index_col=0即可。
在写入csv文件的时候,默认会自动加入新的一列,Unnamed:0
解决方案:
to_csv()时候,设置index=False。或者加上index=True, index_label="id"
以上就是怎么在python中使用pandas合并Sheet,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注编程网行业资讯频道。