Я получаю от клиента base64 данные (video/webm (mp4)), который содержит человеческий голос, записанный через микрофон в реальном времени.
Затем мне нужно отправить эти данные в Google для распознавания речи.
Есть ли универсальный способ улучшить качество этого «звука» (убрать шумы, усилить голос и т. Д.)? Пытался ffmpeg-normalize. Результат далек от приемлемого …
![улучшение качества звука (с микрофона), который поступает в данные видео / webm base64 [closed] TheFAQ.ru](https://thefaq.ru/wp-content/uploads/2023/01/logo-250.png)