Как остановить потоковую передачу HttpResponse в Django в Google Cloud Run?
Мы интегрировали GPT API в наше приложение Django, работающее в Google Cloud Run. Когда пользователь отправляет запрос, мы отправляем ему ответ с помощью StreamingHttpResponse
из django.http
, что позволяет осуществлять потоковую передачу в реальном времени.
Однако в настоящее время у нас нет возможности для пользователей остановить текущую потоковую передачуhttpresponse. Мы ищем решение для досрочного прекращения потока в случае необходимости — без использования WebSockets и без использования Redis или других сервисов, для которых требуются VPC-коннекторы, поскольку на данный момент они обходятся нам дорого.
Есть ли способ добиться этого в рамках существующей настройки Google Cloud Run?
как вам удалось заставить это работать?
Мой облачный запуск буферизует ответ, и я перепробовал много разных способов, чтобы заставить его работать, но безуспешно.
Я был бы признателен, если бы вы смогли пролить немного света на это.