Django Celery: 6-секундная задержка при регистрации задачи из пользовательского интерфейса в среде Kubernetes – распределение ресурсов?

Мы наблюдаем задержку в ~6 секунд, когда задача Celery запускается через пользовательский интерфейс Django (например, my_task.delay()). Наш стек работает на Kubernetes, и мне интересно, связано ли это отставание с ограниченностью ресурсов или с чем-то еще.

Основные сервисы и конфигурация их ресурсов:

Мы запускаем несколько служб с отслеживанием состояния. Их приблизительные конфигурации ресурсов модуля следующие:

  • 1 x JanusGraph: запрашивает 3 процессора, ограничивает 4 процессора
  • 2 x Cassandra: каждый запрашивает 3 процессора, ограничиваясь 4 процессорами
  • 2 x Elasticsearch: каждый запрашивает 3 процессора, ограничиваясь 4 процессорами
  • У нас также есть другие приложения, работающие на этих узлах.

Распределение узлов Kubernetes:

Вот выходные данные узла описания kubectl для наших двух соответствующих узлов, показывающие текущее распределение ресурсов:

Узел 1:

Allocated resources:
  (Total limits may be over 100 percent, i.e., overcommitted.)
  Resource           Requests       Limits
  --------           --------       ------
  cpu                12410m (78%)   17400m (110%)
  memory             14706Mi (23%)  25744Mi (41%)
  ephemeral-storage  9Gi (1%)       18Gi (3%)
  hugepages-1Gi      0 (0%)         0 (0%)
  hugepages-2Mi      0 (0%)         0 (0%)

Узел 2:

Allocated resources:
  (Total limits may be over 100 percent, i.e., overcommitted.)
  Resource           Requests       Limits
  --------           --------       ------
  cpu                8510m (54%)    15900m (101%)
  memory             16076Mi (25%)  28824Mi (46%)
  ephemeral-storage  17Gi (3%)      34Gi (6%)
  hugepages-1Gi      0 (0%)         0 (0%)
  hugepages-2Mi      0 (0%)         0 (0%)

Проблема:

Когда действие пользователя в пользовательском интерфейсе запускает задачу Celery (например, my_task.delay()), перед завершением запроса возникает заметная 6-секундная пауза, и задача, предположительно, подтверждается брокером Celery.

Вопросов:

Может ли уровень использования ресурсов на узлах Kubernetes, в частности, чрезмерные запросы и ограничения ЦП, быть основной причиной задержки регистрации задачи Celery или может быть другая причина??

Вернуться на верх