文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

Python怎么将pdf转为图片?Python如何实现pdf文件转图片

2023-09-02 09:29

关注

而pdf则是用来保存一些内容已经确定好的数据,因为pdf是无法直接修改内容的,所以也会经常将pdf转为图片来保存。本文就将会来介绍一下pdf转图片的方法,往下看看吧。

1.pdf转图片的话主要实现所需要的模块叫做PyMuPDF,它就是用来操作pdf文件的,通过pip工具下载安装即可。除了这个模块之外还需要用到os模块,它是用来读取pdf文件并在转为图片后将其保存起来的,示例如下:

import datetimeimport osimport fitz    # 这个就是PyMuPDF模块

2.那么为了保证这个功能能够重复的使用,所以需要用函数将主要实现的代码保存起来。并且函数的参数需要是读取pdf的文件路径和保存图片的文件路径,示例如下:

def pyMuPDF_fitz(pdfPath, imagePath):    pdfDoc = fitz.open(pdfPath)

3.函数创建好之后并且使用fitz.open()方法打开一个pdf文件生成文件对象,接下来就需要去使用for循环将pdf文件的内容给读取出来。然后在循环之中去设置一下图片的分辨率和dpi等参数,在循环之中实际上是将pdf文件内容写入到一个图片对象中,代码如下:

for pg in range(pdfDoc.pageCount):    page = pdfDoc[pg]    rotate = int(0)    zoom_x = 1.33333333    zoom_y = 1.33333333    mat = fitz.Matrix(zoom_x, zoom_y).preRotate(rotate)    pix = page.getPixmap(matrix=mat, alpha=False)

4.图片内容写入并且生成完之后就要使用os模块去判断一下保存图片的文件路径是否存在了,如果不存在则创建一个来保存,示例如下:

if not os.path.exists(imagePath):     os.makedirs(imagePath) pix.writePNG(imagePath + '/' + 'images_%s.png' % pg)

5.最后在_mian_方法中调用这个函数,这样就可以作为模块去使用了,代码如下:

if __name__ == "__main__":    pdfPath = 'demo1.pdf'    imagePath = './imgs'pyMuPDF_fitz(pdfPath, imagePath)

以上就是关于“Python怎么将pdf转为图片?Python如何实现pdf文件转图片”的全部内容了,希望对你有所帮助。

import datetimeimport osimport fitz  # fitz就是pip install PyMuPDFdef pyMuPDF_fitz(pdfPath, imagePath):    startTime_pdf2img = datetime.datetime.now()  # 开始时间    print("imagePath=" + imagePath)    pdfDoc = fitz.open(pdfPath)    for pg in range(pdfDoc.pageCount):        page = pdfDoc[pg]        rotate = int(0)        # 每个尺寸的缩放系数为1.3,这将为我们生成分辨率提高2.6的图像。        # 此处若是不做设置,默认图片大小为:792X612, dpi=96        zoom_x = 1.33333333  # (1.33333333-->1056x816)   (2-->1584x1224)        zoom_y = 1.33333333        mat = fitz.Matrix(zoom_x, zoom_y).preRotate(rotate)        pix = page.getPixmap(matrix=mat, alpha=False)        if not os.path.exists(imagePath):  # 判断存放图片的文件夹是否存在            os.makedirs(imagePath)  # 若图片文件夹不存在就创建        pix.writePNG(imagePath + '/' + 'images_%s.png' % pg)  # 将图片写入指定的文件夹内    endTime_pdf2img = datetime.datetime.now()  # 结束时间    print('pdf2img时间=', (endTime_pdf2img - startTime_pdf2img).seconds)if __name__ == "__main__":    # 1、PDF地址    pdfPath = 'demo1.pdf'    # 2、需要储存图片的目录    imagePath = './imgs'    pyMuPDF_fitz(pdfPath, imagePath)

来源地址:https://blog.csdn.net/Rick_M/article/details/129572194

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     807人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     351人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     314人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     433人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     221人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯