Потоковый ответ буферизуется при использовании uvicorn/gunicorn/daphne в Django

У меня есть очень простое представление, которое транслирует повторный запрос. При использовании python manage.py runserver поток работает так, как ожидалось. Но когда мы используем uvicorn app.asgi:application или daphne app.asgi:application или gunicorn app.asgi:application, поток буферизуется в пользовательском интерфейсе, и ответ приходит завершенным, а не фрагментами.

    result = core_services.generate_ai_v3_response(
        prompt=prompt,
        previous_response_id=previous_response_id,
        broker_id=broker_id,
    )

    response = StreamingHttpResponse(result, content_type="text/event-stream")

    # Add proper streaming headers
    # Add aggressive streaming headers
    response["Cache-Control"] = "no-cache"
    response["X-Accel-Buffering"] = "no"

    return response
Вернуться на верх