Как создать приложение Django для манипулирования записями VuFind с помощью PySolr?

Я работаю над проектом, в котором мне нужно извлекать записи метаданных, манипулировать ими и управлять ими, хранящиеся в индексе VuFind Solr. Цель состоит в том, чтобы создать приложение на базе Django, которое использует PySolr для:

  • Извлекать данные из ядра Solr VuFind.
  • Выполнять поиск и редактировать записи в индексе Solr.
  • Выявление дубликатов и управление ими, включая: (Поиск повторяющихся записей на основе определенных полей; Объединение повторяющихся записей; Стандартизация записей путем нормализации данных в выбранных полях)

Я написал некоторый пользовательский код для взаимодействия с ядром Vufind Solr, но столкнулся с проблемами, связанными с:

  • Эффективное выполнение запросов к большим наборам данных (например, поиск по миллионам записей).
  • Реализована надежная логика дедупликации (учитывающая множество полей и взвешенное сопоставление).
  • Обновление записей в Solr без изменения несвязанных данных.
  • Разработка удобного интерфейса для просмотра, редактирования и объединения записей.
  • Проблема с выполнением кода: когда я запускаю код, он выполняется неправильно. Браузер не открывается, и я не могу понять, что может пойти не так.

вот полный файл с кодом

Вернуться на верх