DeepSpeech прекращен (2020)=news.ycombinator.com=

DeepSpeech прекращен (2020) ( github.com/mozilla )

dabinat 2 часа назад | [–]
Его прекратили поддерживать 5 лет назад — не знаю, почему архивация репозитория заняла так много времени.

https://discourse.mozilla.org/t/future-of-deepspeech-stt-aft…

отвечать

ПриветИмя пользователя 51 минута назад | | [–]
Возможно, URL-адрес OP можно изменить на https://www.phoronix.com/news/Mozilla-DeepSpeech-Discontinue…

отвечать

LorenDB 32 минуты назад | | | [–]
Я бы изменил, но эта заявка уже прошла окно редактирования. Возможно, dang или tomhow увидят это и изменят для меня 🙂

отвечать

ПриветИмя пользователя 3 минуты назад | | | [–]
Тогда комментарии следует перенести сюда: https://news.ycombinator.com/item?id=44380572

отвечать

altairprime 22 минуты назад | | | | [–]
Вам следует написать им об этом по электронной почте!

отвечать

xeonmc 17 минут назад | | | [–]
Представьте себе альтернативную временную линию, в которой Mozilla назвала бы этот проект «FreeSpeech» как бесплатное и открытое решение TTS.

отвечать

quentindanjou 7 минут назад | | [–]
Похоже, что команда, работавшая над DeepSpeech, затем работала над coqui-ai STT https://github.com/coqui-ai/STT и теперь рекомендует использовать OpenAI Whisper ( https://github.com/openai/whisper )

отвечать

ipsum2 1 час назад | | [–]
Я использовал модель Nvidia parakeet, она лучше, чем Whisper v3 большой и маленький. Поддерживает только английский язык.

https://huggingface.co/nvidia/parakeet-tdt-0.6b-v2

отвечать

нико 1 час назад | | [–]
Нужен ли ему более новый графический процессор? Или он может работать только на центральном процессоре?

Будет ли он работать на Raspberry Pi?

отвечать

ipsum2 39 минут назад | | | [–]
Если вам нужен режим реального времени, то нужен GPU, но его может быть недостаточно. CPU немного медленнее, но работает нормально.

отвечать

GaggiX 1 час назад | | | | [–]
Поищите более быстрые модели шепота или очищенного шепота, более мелкие модели работают довольно хорошо, но плохо работают за пределами английского языка. Если вас интересует другой язык, лучше настроить его более точно (у HuggingFace есть огромное количество точно настроенных моделей шепота).

отвечать

msgodel 38 минут назад | [–]
Я по-прежнему предпочитаю Festival, он быстрый, есть во всех репозиториях пакетов, и мне не нравятся автоматизации с реалистичными голосами.

отвечать

i80and 28 минут назад | [–]
Они противоположны: DeepSpeech — это преобразование речи в текст, а Festival — это преобразование текста в текст.

отвечать


Рассмотрите возможность подачи заявки на набор в YC на осень 2025 года! Заявки принимаются до 4 августа

Source: news.ycombinator.com

Leave a Reply

Your email address will not be published. Required fields are marked *