Kimi K2.7-Code: modello open-weight per coding agentico

Cos'è

Kimi K2.7-Code è un modello linguistico specializzato nel codice, annunciato da Moonshot AI il 12 giugno 2026. A differenza dei modelli generalisti, è progettato per compiti di ingegneria del software a lungo orizzonte: leggere interi repository, modificare file, eseguire test, interagire con strumenti esterni e debuggare in autonomia attraverso molteplici step. È distribuito con pesi aperti sotto una licenza Modified MIT, il che consente di scaricarlo, ispezionarlo e ospitarlo su infrastruttura propria, a patto di rispettare le clausole specifiche riportate nel repository ufficiale.

L'architettura è una Mixture of Experts (MoE): 1 trilione di parametri totali, di cui solo 32 miliardi vengono attivati per ogni token processato. Il modello seleziona 8 esperti per token più uno condiviso, su un totale di 384 esperti distribuiti su 61 layer. L'attenzione usa MLA (Multi-head Latent Attention) e il feed-forward impiega SwiGLU, soluzioni comuni nei modelli di ultima generazione per gestire contesti lunghi con maggiore efficienza. Il contesto massimo arriva a 256.000 token, una quantità sufficiente a contenere codebase di medie dimensioni, documentazione, log di esecuzione e diff di pull request all'interno dello stesso prompt. Inoltre, il modello accetta input multimodali — immagini e video — grazie a un encoder visivo MoonViT da 400 milioni di parametri.

A cosa serve

K2.7-Code è pensato per il coding agentico, non per la semplice autocompletazione di snippet. Si tratta di un motore per agenti in grado di lavorare su intere basi di codice, seguendo un obiettivo attraverso molti passaggi. Le applicazioni più dirette includono:

Refactoring su larga scala: il modello può leggere più moduli, identificare duplicazioni, proporre ristrutturazioni coerenti e rieseguire i test finché non tornano verdi. È utile quando una libreria cambia API o quando si vuole ridurre il debito tecnico accumulato nel tempo.

Kimi K2.7-Code: modello open-weight per coding agentico

Cos'è

A cosa serve

🤔 Hai domande su questo argomento?

Continua a leggere

Qwen3-Embedding: embedding testuali multilingui open source di Alibaba Cloud

SmolLM3: scheda del modello di linguaggio compatto di Hugging Face

Come funziona

Perché conta

Limiti e cautele

Dove trovarlo

Moondream: famiglia di Vision-Language Model open source efficienti

Kokoro TTS: modello open-weight di sintesi vocale da 82M parametri