Инновационная речевая модель.
Gazelle v0.2 способна обрабатывать устные запросы и длинные аудиофайлы без предварительной транскрипции и распознавания речи, за счет чего модель работает быстрее и точнее. Самое интересное, она умеет интерпретировать эмоции и даже сарказм.
Gazelle v0.2 способна обрабатывать устные запросы и длинные аудиофайлы без предварительной транскрипции и распознавания речи, за счет чего модель работает быстрее и точнее. Самое интересное, она умеет интерпретировать эмоции и даже сарказм.
Авторы утверждают, что это первая и единственная open source модель, способная вести диалог в реальном времени.
• Github
• Huggingface
• Попробовать
#иинструмент