
Mistral Small 4: scheda tecnica del modello AI open source di Mistral
Caratteristiche, benchmark, casi d'uso e limiti del modello multimodale MoE rilasciato a marzo 2026 da Mistral AI con licenza Apache 2.0.
Cos'è
Mistral Small 4 è un modello di linguaggio di grandi dimensioni (LLM) sviluppato da Mistral AI, startup francese specializzata in intelligenza artificiale generativa. È stato rilasciato il 16 marzo 2026 come evoluzione della famiglia Mistral Small e rappresenta il primo tentativo dell'azienda di unificare in un unico modello tre competenze precedentemente distribuite tra prodotti separati: il reasoning avanzato di Magistral, le capacità multimodali di Pixtral e il coding agentico di Devstral.
Il modello è distribuito con licenza Apache 2.0, coerentemente con la strategia di Mistral AI di offrire pesi aperti e personalizzabili. Questo lo rende utilizzabile sia tramite API gestite — ad esempio sulla piattaforma ufficiale di Mistral, su NVIDIA NIM o tramite provider terzi — sia in self-hosting su infrastruttura proprietaria, con i vincoli hardware che un'architettura di questa dimensione comporta.
Dal punto di vista architetturale, Mistral Small 4 è un modello Mixture of Experts (MoE): dispone di 128 esperti, di cui solo 4 vengono attivati per ogni token. Il risultato è un modello con 119 miliardi di parametri totali ma un costo computazionale per token molto più contenuto, paragonabile a quello di un modello denso di dimensioni nettamente inferiori.
A cosa serve / dove eccelle
Mistral Small 4 è progettato per essere un modello polivalente ad alta efficienza. La sua caratteristica distintiva è la possibilità di regolare dinamicamente la profondità del ragionamento tramite il parametro reasoning_effort: impostandolo su "none" il modello restituisce risposte rapide e leggere, simili a quelle di Mistral Small 3.2; impostandolo su "high" attiva un ragionamento passo-passo più articolato, comparabile per verbosità e profondità ai modelli Magistral.
Questa flessibilità lo rende adatto a workflow eterogenei in cui convivono richieste semplici — classificazione, estrazione dati, risposte a FAQ — e richieste complesse che richiedono pianificazione multi-step, matematica o ragionamento scientifico. L'utente o il sistema può decidere per ogni singola richiesta quanto ragionamento attivare, evitando di pagare il costo computazionale di un modello di reasoning su task banali. Grazie al supporto nativo per input testuali e visivi e all'output strutturato in JSON, il modello eccelle in analisi documentale, automazione aziendale e sistemi RAG su corpus estesi.
Caratteristiche e specifiche
Le specifiche tecniche ufficiali riportate da Mistral AI sono le seguenti:
| Caratteristica | Valore |
|---|---|
| Parametri totali | 119 miliardi |
| Parametri attivi per token | 6 miliardi (8 miliardi inclusi embedding e output layers) |
| Architettura | Mixture of Experts (MoE), 128 esperti, 4 attivi per token |