当你看pdf,想直接将其转换为word复制粘贴时,这时可能会想到使用wps转换,或者直接在浏览器搜索pdf免费转换word,但是很多都不是免费的,或者就是需要绑定自己的微信账号、电话号码,这极有可能造成信息泄露,这时候python就可以帮上你的忙。
第一步:安装相关的包
pip install pdf2docx -i https://pypi.douban.com/simple/
第二步:创建存放pdf的文件夹,可以将pdf批量存放到一个文件夹下面
第三步:执行程序
from pdf2docx import Converter
import os
def convert_pdf_to_docx(pdf_path, docx_path):
cv = Converter(pdf_path)
cv.convert(docx_path, start=0, end=None)
cv.close()
def batch_convert_pdfs_to_docx(input_folder, output_folder):
# 检查输出文件夹是否存在,如果不存在则创建
if not os.path.exists(output_folder):
os.makedirs(output_folder)
# 遍历输入文件夹中的所有PDF文件
for pdf_file in os.listdir(input_folder):
if pdf_file.endswith(".pdf"):
pdf_path = os.path.join(input_folder, pdf_file)
# 构建输出Word文档的路径,保留文件名但更改扩展名
docx_file = os.path.splitext(pdf_file)[0] + ".docx"
docx_path = os.path.join(output_folder, docx_file)
服务器托管网# 将PDF转换为Word文档
convert_pdf_to_docx(pdf_path, docx_path)
print(f"Converted: {pdf_path} -> {docx_path}")
if __name__ == "__main__":
i服务器托管网nput_folder = "D://OOO//pdf" # 输入PDF文件夹路径 要输入文件夹的路径,在文件夹下面放上pdf文件
output_folder = "D://OOO//pdf" # 输出Word文档文件夹路径
batch_convert_pdfs_to_docx(input_folder, output_folder)
效果对比:整体效果还是有点不太行
随后我找了几个效果还不错的网站,大家可以去试试:
https://www.pdfpai.com/pdf-to-word
https://www.ilovepdf.com/zh-cn/pdf_to_word
服务器托管,北京服务器托管,服务器租用 http://www.fwqtg.net