MiMo 2.5 Pro: scheda del modello AI agentico di Xiaomi

Caratteristiche, benchmark e casi d'uso del modello a 1,02T di parametri (42B attivi) con contesto da 1 milione di token, rilasciato da Xiaomi nell'aprile 2026.

7 min di lettura

Cos'è

MiMo 2.5 Pro (identificativo API: mimo-v2.5-pro) è un large language model sviluppato da Xiaomi e rilasciato ad aprile 2026. Rappresenta il modello di punta della famiglia MiMo ed è progettato per compiti che richiedono ragionamento prolungato, coding avanzato e capacità agentiche. Contrariamente al modello base MiMo-V2.5, che è nativamente omni-modale (testo, immagini, audio, video), la variante Pro è ottimizzata per l'elaborazione testuale e il codice, con un focus specifico su flussi di lavoro autonomi a più passaggi.

Xiaomi ha reso MiMo 2.5 Pro disponibile con pesi aperti su Hugging Face sotto una licenza permissiva. Accanto alla versione estesa a 1 milione di token esiste anche una versione Base con contesto da 256.000 token. L'architettura si basa su una Mixture-of-Experts (MoE) con 1,02 trilioni di parametri totali e 42 miliardi attivi per token. L'attenzione è ibrida: Sliding Window Attention e Global Attention sono intervallate in rapporto 6:1 con una finestra da 128 token, una scelta che riduce la memoria della KV cache di circa sette volte su contesti lunghi preservando le prestazioni. Un modulo di Multi-Token Prediction (MTP) permette di generare più token in parallelo, aumentando il throughput in fase di inferenza.

Il pre-training è avvenuto su 27 trilioni di token con precisione FP8 a lunghezza di sequenza nativa di 32.000 token, poi estesa fino a 1 milione. Il post-training segue un paradigma a tre stadi: Supervised Fine-Tuning su coppie dati curate, Domain-Specialized Training con modelli insegnante ottimizzati per matematica, sicurezza, uso di strumenti e altri domini, e infine Multi-Teacher On-Policy Distillation (MOPD), in cui il modello studente apprende dai propri rollout guidato a livello di token da ogni insegnante specializzato.

A cosa serve / dove eccelle

Il modello è posizionato come strumento per agenti software e ingegneria complessa. Secondo i dati pubblicati da Xiaomi, eccelle in tre aree principali:

Coding agentic: risoluzione di bug reali in repository esistenti, esecuzione di comandi in terminale e sviluppo di progetti software a partire da requisiti espressi in linguaggio naturale.
Task a lungo orizzonte: capacità di mantenere coerenza e seguire istruzioni articolate attraverso centinaia o migliaia di chiamate a strumenti esterni.
Ragionamento strutturato: compiti che richiedono pianificazione multi-step, auto-correzione e gestione della memoria all'interno del contesto.

Xiaomi sottolinea anche l'efficienza in token: su ClawEval, MiMo 2.5 Pro raggiunge il 64% di Pass^3 con circa 70.000 token per traiettoria, una cifra stimata dal 40 al 60% inferiore rispetto a modelli concorrenti di pari capacità. Questo aspetto è rilevante per chi esegue migliaia di richieste al giorno, perché il numero di token generati ha un impatto diretto sia sui tempi di risposta sia sul costo della fattura API.

Caratteristica	Valore
Parametri totali	1,02T
Parametri attivi	42B
Contesto	1.048.576 token (versione Pro); 256K nella versione Base
Architettura	MoE con attenzione ibrida (Sliding Window + Global 6:1, finestra 128 token)
Precisione	FP8 (E4M3) mixed
Token di pre-training	27T
Post-training	SFT, Domain-Specialized RL, Multi-Teacher On-Policy Distillation
Output massimo	131.072 token (secondo aggregatori di modelli)
Prezzo indicativo API	$1,00 / 1M token in input, $3,00 / 1M token in output
Velocità dichiarata	60-80 token/s

MiMo 2.5 Pro: scheda del modello AI agentico di Xiaomi

Cos'è

A cosa serve / dove eccelle

Caratteristiche e specifiche

Punti di forza

Quando ha senso (e quando no)

Casi d'uso concreti

Alternative e contesto

In sintesi

Risorse