
GLM 5.1: modello open weights di Zhipu AI per coding autonomo
Scheda tecnica e operativa su GLM 5.1, LLM MoE di Zhipu AI sotto licenza MIT, ottimizzato per task di ingegneria del software a lungo orizzonte.
Cos'è
GLM 5.1 è un large language model (LLM) sviluppato da Zhipu AI, laboratorio cinese attivo anche con il brand internazionale Z.ai. Rilasciato nell'aprile 2026, rappresenta l'evoluzione della famiglia GLM (General Language Model) ed è posizionato come modello open weights di punta dell'azienda. A differenza di molti concorrenti closed-source, Zhipu AI ha reso disponibili i pesi completi del modello sotto licenza MIT, permettendo download, self-hosting, fine-tuning e uso commerciale senza le restrizioni tipiche di altre licenze community.
L'architettura è a Mixture of Experts (MoE): secondo le informazioni diffuse da Zhipu AI e riportate nei model card, GLM 5.1 dispone di circa 744 miliardi di parametri totali, con circa 40 miliardi di parametri attivi per token in fase di inferenza. Questo design mira a bilanciare capacità computazionale e efficienza: non tutti gli esperti vengono attivati contemporaneamente, riducendo i costi rispetto a un modello denso di pari dimensioni. Il vocabolario e l'addestramento sono ottimizzati in misura significativa per il cinese e per il codice.
A cosa serve / dove eccelle
GLM 5.1 è progettato in modo esplicito per compiti di ingegneria del software complessi e per esecuzione autonoma prolungata, non solo per risposte punto-punto. Zhipu AI enfatizza la cosiddetta "long-horizon task capability": il modello è in grado di pianificare, eseguire, verificare e iterare su un singolo obiettivo tecnico per molte ore, mantenendo coerenza tra centinaia di chiamate a tool e passaggi di ragionamento.
Le aree di eccellenza principali sono:
- Coding agentic e ingegneria del software reale, in particolare bug fixing, refactoring, generazione end-to-end di repository e ottimizzazione di codebase esistenti.
- Task a lungo orizzonte in cui il modello deve operare autonomamente per periodi prolungati senza intervento umano frequente.
- Contenuti e ragionamento in lingua cinese, grazie a un addestramento bilanciato verso quella lingua.
- Scenari enterprise che richiedono privacy dei dati e deploy on-premise, resi possibili dalla disponibilità dei pesi e dalla licenza permissiva.
Caratteristiche e specifiche
Di seguito i dati tecnici principali così come emergono dalle fonti ufficiali e dai provider che ospitano il modello. Alcune cifre variano leggermente tra le fonti; si riportano i valori più ricorrenti.
- Architettura: Mixture of Experts (MoE), circa 744 miliardi di parametri totali, circa 40 miliardi attivi per token.
- Context window: circa 200.000 token, spesso indicata come 203.000 token.
- Output massimo: fino a circa 66.000 token per risposta; alcune schede tecniche di provider riportano anche 131.000 token.