PDF 到 Word 转换器
import textract
import docx
def pdf_to_word(pdf_file, output_file):
# 提取 PDF 文件的文本
text = textract.process(pdf_file)
# 创建一个新的 Word 文档
document = docx.Document()
# 将文本添加到文档中
document.add_paragraph(text)
# 保存 Word 文档
document.save(output_file)
# 将 PDF 文件转换为 Word 文档
pdf_to_word(‘input.pdf’, ‘output.docx’)