Интеграция ray с django не достигает одинаковой производительности

У меня есть приложение Django + Apache + WSGI, которое имеет определенные конечные точки с определенными действиями, такими как:

Load/Reload names from database [keeps in memory all the data]
Inserting/Updating names [the names loaded in memory]
Searching names similarity [search for the names] (would like to improve performance)

Действие #3 получает некоторые параметры и возвращает соответствующие совпадающие имена согласно логу. Для поиска около 200k ~ 300k имен (многопоточная обработка) требуется около 0.9s, и мне нужно улучшить это время отклика.

Я пробовал использовать модуль мультипроцессинга, но это занимает немного больше времени, чем оригинальная реализация, так как мне нужно делать копию данных или сериализовать/десериализовать данные каждый раз.

После проведения некоторых исследований я нашел ray. Я создал набор данных и протестировал его в локальном и удаленном режиме, и результаты оказались в 3-5 раз быстрее.

Проблема в том, что я не могу найти способ интегрировать мое приложение django в ray logic и достичь той же производительности:

ray.init(ignore_reinit_error=True)
#collecting some data and then calling to ray
results = ray.get(tree.TrieNode.search_name_remote.remote(parameters)

Результаты почти одинаковые.

Я обращаюсь к базе данных только в действии #1 для загрузки данных, поэтому мне не нужно использовать модели или что-то подобное, как в приведенных примерах.

Есть ли способ создать API, аналогичный текущему, и позже масштабировать его на несколько узлов, имеющих те же или новые конечные точки?

Вернуться на верх

Последние вопросы и ответы

Upgrading Django to 5.2.7 causing error wth rest_framework_simplejwt as django.utils.timezone is depreciated

Error running developmental server in Django project some issue with migration

Django static images not showing on Vercel

"SMTPAuthenticationError: Authentication disabled due to threshold limitation" on production server on AWS

Cloud Storage + Cloud Tasks for async webhook processing on Cloud Run - best practice

How do you customise these 3 dots in wagtail?

Django app static files recently started returning 404s, deployed by Heroku

Django Rest Framework ListAPIView user permissions - Cant seem to get them working

Django gunicorn gevent with Statsig - run code in forked process

Django Materialized View Refreshing Celery Task is freezing in DB layer for larger dataset

Интеграция ray с django не достигает одинаковой производительности

Последние вопросы и ответы

Рекомендуемые записи по теме