Проблема с сохранением форматирования (изображений и таблиц) При загрузке обработанного документа в React

Я работаю над проектом, который предполагает манипулирование документами с использованием искусственного интеллекта. Интерфейс создан с помощью React.js, а серверная часть - с помощью Django.

Вот рабочий процесс, который я пытаюсь реализовать:

  1. Пользователь загружает документ в формате .docx, содержащий текст, изображения и таблицы.

  2. Документ визуализируется и обрабатывается во внешнем интерфейсе (например, изменение текста, удаление страниц и т.д.).

  3. После проведения манипуляций пользователь должен иметь возможность загрузить обновленный документ с сохранением его первоначального форматирования.

В чем проблема:

Всякий раз, когда я загружаю обработанный документ из интерфейса, используя любую библиотеку сохранения файлов (например, file-saver или Blob), форматирование теряется - все изображения и таблицы удаляются, и сохраняется только обычный текст.

То, что я пробовал

Я создал большой двоичный файл HTML из документа и установил для него MIME-тип application/vnd.openxmlformats-officedocument.wordprocessingml.document, затем сохранил его с расширением .docx.

При этом сохраняется некоторое форматирование, например, стили текста и разметка. Но при открытии загруженного файла .docx в Word изображения искажаются или отображаются некорректно.

Я понимаю, что документы Word — это не просто HTML с другим расширением, они соответствуют строгому формату Open XML. Так что, вероятно, именно из-за того, что HTML маскируется под .docx, изображения не работают.

Вернуться на верх