Инновационная речевая модель.

23 мая 2024 15:12

Gazelle v0.2 способна обрабатывать устные запросы и длинные аудиофайлы без предварительной транскрипции и распознавания речи, за счет чего модель работает быстрее и точнее. Самое интересное, она умеет интерпретировать эмоции и даже сарказм.

Авторы утверждают, что это первая и единственная open source модель, способная вести диалог в реальном времени.

• Github

• Huggingface

• Попробовать

#иинструмент

Назад к списку