python将多个pdf合成一个-编程学习网

'''# -*- coding:utf-8*-'''
import sys
import importlib
importlib.reload(sys)

import os
import os.path
from PyPDF2 import PdfFileReader, PdfFileWriter  
import time
time1=time.time()

# 使用os模块walk函数，搜索出某目录下的全部pdf文件
######################获取同一个文件夹下的所有PDF文件名#######################
def getFileName(filepath):
    file_list = []
    for root,dirs,files in os.walk(filepath):
        for filespath in files:
            # print(os.path.join(root,filespath))
            file_list.append(os.path.join(root,filespath))

    return file_list



##########################合并同一个文件夹下所有PDF文件########################
def MergePDF(filepath,outfile):
    output=PdfFileWriter()
    outputPages=0
    in_file_path =filepath +r'input/'
    print(in_file_path)
    pdf_fileName=getFileName(in_file_path)
    i=0
    for each in pdf_fileName:
        i=i+1
        print(i,each)
        # 读取源pdf文件
        input = PdfFileReader(open(each, "rb"))

        # 如果pdf文件已经加密，必须首先解密才能使用pyPdf
        if input.isEncrypted == True:
            input.decrypt("map")

        # 获得源pdf文件中页面总数
        pageCount = input.getNumPages()
        outputPages += pageCount
        print("PageCount: ",pageCount)

        # 分别将page添加到输出output中
        for iPage in range(0, pageCount):
            output.addPage(input.getPage(iPage))


    print("All Pages Number:"+str(outputPages))
    # 最后写pdf文件
    out_file_path=filepath+r'output/'
    outputStream=open(out_file_path+outfile,"wb")
    output.write(outputStream)
    outputStream.close()
    print( "finished")


if __name__ == '__main__':
    file_dir = r'D:/扫描文件/'     # 待合并PDF 所在文件夹
    out=u"某某资料合并文件.pdf"        # 合并后文件名称
    MergePDF(file_dir,out)
    time2 = time.time()
    print( u'总共耗时：' + str(time2 - time1) + 's')

使用注意事项
1、程序第63行，默认指定了一个目录，“D:\扫描文件“，然后在其下建“\input”和“\output”两个子文件夹。
2、将待合并的pdf文件放在“\input”中，合并后的文件默认为“某某资料合并文件.pdf”，可在程序第64行修改你期望的文件名，合并后文件输出到“\output”。
3、合并多个文件时，合并顺序为文件名升序。
补充说明，如何使用python，建议学一本免费的电子书《编程小白的第一本Python入门书》，网上可搜。

最后，如果哪位朋友有兴趣，可以将程序第63和64行，加一个图形界面，用户在window下选择input 和output，选择输出文件名，然后做一个可执行文件。

文章详情

python将多个pdf合成一个

软考中级精品资料免费领

相关文章

猜你喜欢

python将多个pdf合成一个

windows怎么将多个pdf合成一个pdf

如何在 Java 中将多个 PDF 文件合并为一个 PDF

Python 多张图片合并成一个pdf的参考示例

Linux如何将多个文件内容合成一个

pdf文件如何合并成一个

多个openstack合并成一个openstack的多个region

怎么在JavaScript中将多个对象合并成一个数组

将pdf文件拆分成多个文件的教程

python生成一个简单的pdf文件

怎么将多个select的结果合并成一张表

Python实现多个视频合成一个视频的功能

Java使用POI将多个Sheet合并为一个Sheet

怎样将多个html文件合并一个文件

wps如何把多个文档合并成一个

Python合并多张图片成PDF

PHP把两个或多个数组合并成一个数组

如何将多个php数组转成一个json数据

多个 EXCEL文件怎么合并成一个文件

python怎么把两个字符串合成一个