Расшифровка потоков аудиоданных в реальном времени с помощью Python

Я разработал веб-приложение, используя Django в качестве бэкенда и библиотеку Frontend.

Я использовал django-channels, для WebSocket и я могу записать аудио поток с передней части и отправить его в Django через WebSocket, а затем Django отправляет его в группу.

Итак, я могу делать аудио звонки (допустим), но мне нужно расшифровывать аудио на бэкенде. (основная цель проекта)

Я с нетерпением жду возможности использовать пакет SpeechRecognition 3.8.1 для достижения транскрипции.

Я отправляю base64 закодированную opus строку кодеков с фронт-энда на Django каждую секунду. Он посылает записанный микрофоном звук каждую 1 секунду.

Мои сомнения -

Если мы воспроизводим аудиопотоки независимо, мы можем воспроизвести только первую строку. Мы не можем воспроизвести 2-ю, 3-ю .... независимо (проблемы с прокладкой или, возможно, что-то еще, о чем я не знаю), поэтому я использовал MediaSource на фронт-энде для буферизации потоков и воспроизведения. Вопрос в том, можно ли преобразовать этот 2-й 3-й аудио поток в текст, используя вышеупомянутый пакет? Или мне придется делать что-то другое. (Я ищу идеи о том, как это будет работать)

Кроме того, вышеупомянутый пакет использует формат wav для транскрибирования аудио, так как я могу преобразовать мою строку, закодированную в base64, в аудиофайл формата wav на ходу? Я видел много примеров использования файлов, но я хочу изменить формат аудио на ходу, а затем сохранить расшифрованные данные в файл/базу данных.

Предоставим любой пример кода, необходимый для лучшего понимания вопроса.

Кроме того, открыт для новых идей по изменению рабочего процесса моего кода для достижения транскрипции.

Спасибо!!!

Вернуться на верх

Последние вопросы и ответы

после попытки контеризировать приложения события Celery перестали обрабатываться [closed]

Unable to run tests django. django.db.utils.ProgrammingError: relation "auth_user" does not exist

gunicorn gevent CERTIFICATE_VERIFY_FAILED error

Wagtail login downgrades to http, gives error

Django media images not loading in production using Nginx , with Debug=False

django-mptt using get_root() on TreeQuerySet element inside for loop and output stored in list does not persist outside of for loop

Why aren't my Django Postgres `ArrayAgg` members sorting?

Django, docker compose, whitenoise and railways: new js files not found in production (it works in local)

How can I display a table in a template with additional category/section rows?

How to support multiple Google Cloud Storage buckets in a Django FileField without breaking .url resolution?

Расшифровка потоков аудиоданных в реальном времени с помощью Python

Последние вопросы и ответы

Рекомендуемые записи по теме