Как извлечь текст из текстового поля word doc с помощью Python/Django и docx
Я пытаюсь извлечь и заменить текст в файле .docx word с помощью библиотеки docx в python (3.7), который я затем сохраняю как "TESTFIL.docx"
Обычный текст параграфа в документе извлекается нормально, и я могу его заменить, однако любой текст в текстовом поле не подхватывается. Буду признателен за любую помощь, советы или библиотеки, которые я могу использовать
Примечание: библиотека Aspose делает и то, и другое, но лицензионная плата в $1000 слишком велика для этого проекта.
Сниппет кода ниже:
def replaceDoc2(self,file,variables):
print("WE Here")
doc=Document(file)
Dictionary = {"NAME": "SHILLAN", "MEMBERSHIPNO":"0007"}
for i in Dictionary:
for p in doc.paragraphs:
print(p.text)
if p.text.find(i)>=0:
p.text=p.text.replace(i,Dictionary[i])
#save changed document
if os.path.exists("TESTFIL.docx"):
os.remove("TESTFIL.docx")
doc.save('TESTFIL.docx')
else:
print("The file does not exist")
doc.save('TESTFIL.docx')