Xiaomi: MiMo-V2-Omni Xiaomi
MiMo-V2-Omni es un modelo omnimodal de vanguardia que procesa de forma nativa entradas de imagen, video y audio dentro de una arquitectura unificada.
Arquitectura
- Modalidad: text+image+audio+video->text
- Modalidades de entrada: text, audio, image, video
- Modalidades de salida: text
- Tokenizador: Other
Contexto y límites
- Longitud del contexto: 262144 tokens
- Máx. tokens de respuesta: 65536 tokens
- Moderación: Deshabilitada
Precios
- Prompt (1K tokens): 4e-07 ₽
- Completion (1K tokens): 2e-06 ₽
- Razonamiento interno: ₽
- Solicitud: ₽
- Imagen: ₽
- Búsqueda web: ₽