Mistral Small 4: scheda tecnica del modello AI open source d

Cos'è

Mistral Small 4 è un modello di linguaggio di grandi dimensioni (LLM) sviluppato da Mistral AI, startup francese specializzata in intelligenza artificiale generativa. È stato rilasciato il 16 marzo 2026 come evoluzione della famiglia Mistral Small e rappresenta il primo tentativo dell'azienda di unificare in un unico modello tre competenze precedentemente distribuite tra prodotti separati: il reasoning avanzato di Magistral, le capacità multimodali di Pixtral e il coding agentico di Devstral.

Il modello è distribuito con licenza Apache 2.0, coerentemente con la strategia di Mistral AI di offrire pesi aperti e personalizzabili. Questo lo rende utilizzabile sia tramite API gestite — ad esempio sulla piattaforma ufficiale di Mistral, su NVIDIA NIM o tramite provider terzi — sia in self-hosting su infrastruttura proprietaria, con i vincoli hardware che un'architettura di questa dimensione comporta.

Dal punto di vista architetturale, Mistral Small 4 è un modello Mixture of Experts (MoE): dispone di 128 esperti, di cui solo 4 vengono attivati per ogni token. Il risultato è un modello con 119 miliardi di parametri totali ma un costo computazionale per token molto più contenuto, paragonabile a quello di un modello denso di dimensioni nettamente inferiori.

A cosa serve / dove eccelle

Mistral Small 4 è progettato per essere un modello polivalente ad alta efficienza. La sua caratteristica distintiva è la possibilità di regolare dinamicamente la profondità del ragionamento tramite il parametro reasoning_effort: impostandolo su "none" il modello restituisce risposte rapide e leggere, simili a quelle di Mistral Small 3.2; impostandolo su "high" attiva un ragionamento passo-passo più articolato, comparabile per verbosità e profondità ai modelli Magistral.

Caratteristica	Valore
Parametri totali	119 miliardi
Parametri attivi per token	6 miliardi (8 miliardi inclusi embedding e output layers)
Architettura	Mixture of Experts (MoE), 128 esperti, 4 attivi per token
Contesto massimo	256.000 token
Input	Testo e immagini
Output	Testo
Reasoning	Configurabile (`reasoning_effort`: `none` / `high`)
Tool calling	Nativo
Output strutturato	JSON nativo
Licenza	Apache 2.0
Data di rilascio	16 marzo 2026
Identificativo API	`mistral-small-2603` / `mistral-small-latest`

Mistral Small 4: scheda tecnica del modello AI open source di Mistral

Cos'è

A cosa serve / dove eccelle

🤔 Hai domande su questo argomento?

Continua a leggere

Qwen3-Embedding: embedding testuali multilingui open source di Alibaba Cloud

SmolLM3: scheda del modello di linguaggio compatto di Hugging Face

Caratteristiche e specifiche

Punti di forza

Quando ha senso (e quando no)

Casi d'uso concreti

Alternative e contesto

In sintesi

Risorse

Moondream: famiglia di Vision-Language Model open source efficienti

Kokoro TTS: modello open-weight di sintesi vocale da 82M parametri