Преобразователь PDG в Word
import textract
import docx
def pdf_to_word(pdf_file, output_file):
# Извлечение текста из файла PDF
text = textract.process(pdf_file)
# Создание нового документа Word
document = docx.Document()
# Добавление текста в документ
document.add_paragraph(text)
# Сохранение документа Word
document.save(output_file)
# Преобразование файла PDF в документ Word
pdf_to_word(‘input.pdf’, ‘output.docx’)