Проблема с сохранением форматирования (изображений и таблиц) При загрузке обработанного документа в React
Я работаю над проектом, который предполагает манипулирование документами с использованием искусственного интеллекта. Интерфейс создан с помощью React.js, а серверная часть - с помощью Django.
Вот рабочий процесс, который я пытаюсь реализовать:
Пользователь загружает документ в формате .docx, содержащий текст, изображения и таблицы.
Документ визуализируется и обрабатывается во внешнем интерфейсе (например, изменение текста, удаление страниц и т.д.).
После проведения манипуляций пользователь должен иметь возможность загрузить обновленный документ с сохранением его первоначального форматирования.
В чем проблема:
Всякий раз, когда я загружаю обработанный документ из интерфейса, используя любую библиотеку сохранения файлов (например, file-saver или Blob), форматирование теряется - все изображения и таблицы удаляются, и сохраняется только обычный текст.
То, что я пробовал
Я создал большой двоичный файл HTML из документа и установил для него MIME-тип application/vnd.openxmlformats-officedocument.wordprocessingml.document, затем сохранил его с расширением .docx.
При этом сохраняется некоторое форматирование, например, стили текста и разметка. Но при открытии загруженного файла .docx в Word изображения искажаются или отображаются некорректно.
Я понимаю, что документы Word — это не просто HTML с другим расширением, они соответствуют строгому формату Open XML. Так что, вероятно, именно из-за того, что HTML маскируется под .docx, изображения не работают.