Как создать приложение Django для манипулирования записями VuFind с помощью PySolr?
Я работаю над проектом, в котором мне нужно извлекать записи метаданных, манипулировать ими и управлять ими, хранящиеся в индексе VuFind Solr. Цель состоит в том, чтобы создать приложение на базе Django, которое использует PySolr для:
- Извлекать данные из ядра Solr VuFind.
- Выполнять поиск и редактировать записи в индексе Solr.
- Выявление дубликатов и управление ими, включая: (Поиск повторяющихся записей на основе определенных полей; Объединение повторяющихся записей; Стандартизация записей путем нормализации данных в выбранных полях)
Я написал некоторый пользовательский код для взаимодействия с ядром Vufind Solr, но столкнулся с проблемами, связанными с:
- Эффективное выполнение запросов к большим наборам данных (например, поиск по миллионам записей).
- Реализована надежная логика дедупликации (учитывающая множество полей и взвешенное сопоставление).
- Обновление записей в Solr без изменения несвязанных данных.
- Разработка удобного интерфейса для просмотра, редактирования и объединения записей.
- Проблема с выполнением кода: когда я запускаю код, он выполняется неправильно. Браузер не открывается, и я не могу понять, что может пойти не так.