Xiaomi: MiMo-V2-Omni Xiaomi

MiMo-V2-Omni — это передовая омнимодальная модель, которая естественным образом обрабатывает входные изображения, видео и аудио в рамках унифицированной архитектуры.

Архитектура

  • Модальность: text+image+audio+video->text
  • Входные модальности: text, audio, image, video
  • Выходные модальности: text
  • Токенизатор: Other

Контекст и лимиты

  • Длина контекста: 262144 токенов
  • Макс. токенов ответа: 65536 токенов
  • Модерация: Отключена

Стоимость

  • Prompt (1K токенов): 4e-05 ₽
  • Completion (1K токенов): 0.0002 ₽
  • Внутреннее рассуждение: ₽
  • Запрос: ₽
  • Изображение: ₽
  • Веб-поиск: ₽