Как остановить потоковую передачу HttpResponse в Django в Google Cloud Run?

Мы интегрировали GPT API в наше приложение Django, работающее в Google Cloud Run. Когда пользователь отправляет запрос, мы отправляем ему ответ с помощью StreamingHttpResponse из django.http, что позволяет осуществлять потоковую передачу в реальном времени.

Однако в настоящее время у нас нет возможности для пользователей остановить текущую потоковую передачуhttpresponse. Мы ищем решение для досрочного прекращения потока в случае необходимости — без использования WebSockets и без использования Redis или других сервисов, для которых требуются VPC-коннекторы, поскольку на данный момент они обходятся нам дорого.

Есть ли способ добиться этого в рамках существующей настройки Google Cloud Run?

как вам удалось заставить это работать?

Мой облачный запуск буферизует ответ, и я перепробовал много разных способов, чтобы заставить его работать, но безуспешно.

Я был бы признателен, если бы вы смогли пролить немного света на это.

Вернуться на верх