使用Python自由切分pdf文件提取任意页面-白红宇

使用Python自由切分pdf文件提取任意页面

阅读量：279 次

发布时间：2019-03-01

本文共 764 字，大约阅读时间需要 2 分钟。

推荐教材：《Python程序设计基础与应用》（ISBN：9787111606178），董付国，机械工业出版社。

问题描述：给定一个PDF文件，对其进行任意切分，提取其中任意页面，保存为新的PDF文件。

准备工作：安装扩展库PyPDF2，参考命令pip install PyPDF2。

代码示例：

import PyPDF2def extract_pages(pdf_path):    # 读取PDF文件    pdf = PyPDF2.PdfReader(pdf_path)    # 提取每一页    pages = []    for page in pdf.pages:        pages.append(page)    return pages# 示例使用if __name__ == "__main__":    import sys    input_path = sys.argv[1]    pages = extract_pages(input_path)    # 保存为新PDF文件    output_path = "extracted_pages.pdf"    with open(output_path, 'wb') as output:        for page in pages:            output.write(page.get_data())    print(f"提取后的PDF文件已保存为：{output_path}")

配套资源：教师可联系董付国老师获取教学大纲、课件、源码、电子教案、考试系统等配套教学资源。

温馨提示：在公众号后台发送消息"大事记"、"教材"、"历史文章"、"会议"、"培训"、"微课"、"课件"、"小屋刷题"可获取更多资源和信息。

转载地址：http://payx.baihongyu.com/

你可能感兴趣的文章

Nginx的是什么？干什么用的？

查看>>

Nio ByteBuffer组件读写指针切换原理与常用方法

查看>>

NI笔试——大数加法

查看>>

NLP 基于kashgari和BERT实现中文命名实体识别（NER）

查看>>