Объединение аудио ввода и текстовых инструкций в одну унифицированную модель

20 июня 2025 г.

Единый мультимодальный подход к обработке речи с помощью LLMS

20 июня 2025 г.

Как мы прошли предварительно обучение аудиоканатора параметров 300 м со случайным квантованием

20 июня 2025 г.

Что нужно для обучения системы ИИ универсальной речи

20 июня 2025 г.

Могут ли модели искусственного интеллекта следовать инструкциям, которые они никогда не видели раньше?

19 июня 2025 г.

Как ограниченное и совместное декодирование улучшает мультимодальные речевые модели

19 июня 2025 г.

Представление Speechverse: крупномасштабная обобщаемая модель аудио-языка

18 июня 2025 г.

Наука, стоящая за аудиозависимыми языковыми моделями

18 июня 2025 г.

Оценка мультимодальных речевых моделей в разных аудиозазадах

18 июня 2025 г.

Speechverse против SOTA: речевые модели с несколькими задачами в реальных эталонах

18 июня 2025 г.