Странные 5-секундные остановки для Django на Kubernetes
У нас есть кластер K8 для размещения некоторых наших сервисов. Эти службы обмениваются друг с другом данными через HTTPS API. Иногда мы наблюдаем, что выполнение сервисов останавливается на 5 секунд, а затем продолжается. Мы испытываем высокую задержку во время этой проблемы и обнаружили, что вызовы API останавливаются на 5 секунд с помощью трассировки APM. Я приложил скриншот одного из таких примеров.
На этих сервисах работает Django с gunicorn, контейнеризированный в образах Ubuntu. В чем может быть причина таких проблем? Связано ли это с разрешением имен или поиском? Это вообще связано с K8 или с чем-то другим? Как мы можем продолжить отладку? Если требуется дополнительная информация, пожалуйста, дайте мне знать. Спасибо.
