Xiaomi: MiMo-V2-Omni Xiaomi
MiMo-V2-Omni — это передовая омнимодальная модель, которая естественным образом обрабатывает входные изображения, видео и аудио в рамках унифицированной архитектуры.
Архитектура
- Модальность: text+image+audio+video->text
- Входные модальности: text, audio, image, video
- Выходные модальности: text
- Токенизатор: Other
Контекст и лимиты
- Длина контекста: 262144 токенов
- Макс. токенов ответа: 65536 токенов
- Модерация: Отключена
Стоимость
- Prompt (1K токенов): 4e-05 ₽
- Completion (1K токенов): 0.0002 ₽
- Внутреннее рассуждение: ₽
- Запрос: ₽
- Изображение: ₽
- Веб-поиск: ₽