文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

基于Python怎么实现对比Exce的工具

2023-06-29 22:07

关注

这篇“基于Python怎么实现对比Exce的工具”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“基于Python怎么实现对比Exce的工具”文章吧。

1.参数

(默认新旧文件列名一致)

2.效果

3.实现

配置

import pandas as pdfrom openpyxl import load_workbook#选择文件路径path=r"C:\Users\小管同学\Desktop\Migration_Data_Compari\对比文件.xls" #input("选择文件路径:")TargetPath=r"C:\Users\小管同学\Desktop\Migration_Data_Comparison_Tool\目标文件\对比结果.xlsx"DATA_ODS=pd.read_excel(r"C:\Users\小管同学\Desktop\Migration_Data_Comparison_Tool\对比文件.xls",sheet_name="ODS")DATA_DWH=pd.read_excel(r"C:\Users\小管同学\Desktop\Migration_Data_Comparison_Tool\对比文件.xls",sheet_name="DWH")#选择主键Primarykey="员工编号"#input("选择主键1:")Primarykey# 员工编号

一、数据量

输出表格1–数据量

def write_to_excel_DataVolume(Data,TargetPath): # cor_df 为要保存的 dataframe     writer = pd.ExcelWriter(TargetPath, engine='xlsxwriter') # 这里用    Data.to_excel(writer,sheet_name='Sheet1', encoding='utf8', header=False, startcol=0, startrow=2) # 把dataframe的数据从第2行开始    workbook  = writer.book        format1 = workbook.add_format({ # 先把样式打包,然后之后赋值即可        'bold': True, # 字体加粗        'text_wrap': True, # 是否自动换行        'valign': 'bottom',  #垂直对齐方式        'align': 'center', # 水平对齐方式        'fg_color': '#C5D9F1', # 单元格背景颜色        'border': 1,# 边框    })        writer_sheet = writer.sheets['Sheet1']    # 设置宽度    writer_sheet.set_column("A:I", 16)    writer_sheet.set_column('C:C',30)    writer_sheet.merge_range(0,0,0,2,'对比结果',format1)    writer_sheet.merge_range(4,2,4,0,'数据量差异',format1)    writer_sheet.write(1,0,'',format1)    writer_sheet.write(1,1,'ODS',format1)    writer_sheet.write(1,2,'DWH',format1)    writer.save()    writer.close()DataFrame_DataVolume=pd.DataFrame([[DATA_ODS.shape[0]],[DATA_DWH.shape[0]]]).TDataFrame_DataVolume.columns =["ODS","DWH"]DataFrame_DataVolume.index=["数据量"]DataFrame_DataVolume#writeFileDataVolume(DataFrame_DataVolume,TargetPath)write_to_excel_DataVolume(DataFrame_DataVolume,TargetPath)

基于Python怎么实现对比Exce的工具

输出表格2–数据量差异合同

if DATA_ODS.shape[0]==DATA_DWH.shape[0]:    passelse:        DATA_ODS_Primarykey=pd.DataFrame(DATA_ODS[Primarykey])    DATA_DWH_Primarykey=pd.DataFrame(DATA_DWH[Primarykey])    df_union = pd.concat([DATA_ODS_Primarykey,DATA_DWH_Primarykey])    # 实现1    df_diff_ODS = df_union.append(DATA_ODS_Primarykey).drop_duplicates(subset=df_union.columns.to_list(), keep=False)    df_diff_DWH = df_union.append(DATA_DWH_Primarykey).drop_duplicates(subset=df_union.columns.to_list(), keep=False)    #DWH多的合同    df_diff_ODS    #DWH少的合同    df_diff_DWH    df_diff_DWH_Data=[]    df_diff_ODS_Data=[]    for i in df_diff_ODS.head(10).values.tolist():        for n in i:            df_diff_ODS_Data.append(n)                for i in df_diff_DWH.head(10).values.tolist():            df_diff_DWH_Data.append(n)    while True:        if len(df_diff_DWH_Data)>len(df_diff_ODS_Data):            df_diff_ODS_Data.append("-")        elif len(df_diff_DWH_Data)< len(df_diff_ODS_Data):            df_diff_DWH_Data.append("-")        elif len(df_diff_DWH_Data)== len(df_diff_ODS_Data):            break    DataFrame_DataVolume_Count_result=pd.DataFrame(df_diff_DWH_Data,df_diff_ODS_Data).reset_index()    DataFrame_DataVolume_Count_result.columns=['DWH多的合同','DWH少的的合同']    DataFrame_DataVolume_Count_result=DataFrame_DataVolume_Count_result.reset_index()    DataFrame_DataVolume_Count_result.columns=['序号','DWH多的合同','DWH少的的合同']DataFrame_DataVolume_Count_resultfrom openpyxl import load_workbook def write_to_excel_Count_result(Data,TargetPath):    df_Old = pd.DataFrame(pd.read_excel(TargetPath)) #读取原数据文件和表     writer = pd.ExcelWriter(TargetPath,engine='openpyxl')    book=load_workbook(TargetPath)    writer.book = book    writer.sheets = dict((ws.title, ws) for ws in book.worksheets)    df_rows = df_Old.shape[0] #获取原数据的行数    Data.to_excel(writer,startrow=df_rows+1, index=False,startcol=0,header=True)#将数据写入excel中的aa表,从第一个空行开始写    writer.save()#保存write_to_excel_Count_result(DataFrame_DataVolume_Count_result,TargetPath)

基于Python怎么实现对比Exce的工具

以上就是关于“基于Python怎么实现对比Exce的工具”这篇文章的内容,相信大家都有了一定的了解,希望小编分享的内容对大家有帮助,若想了解更多相关的知识内容,请关注编程网行业资讯频道。

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     807人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     351人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     314人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     433人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     221人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯