Cos'è
MiniMax M3 è un modello fondazionale multimodale rilasciato il 1° giugno 2026 da MiniMax, laboratorio di intelligenza artificiale con sede a Shanghai. Si colloca come successore della serie M2 — in particolare di MiniMax-M2.7 — e viene posizionato come il primo modello open-weight a combinare in un'unica architettura tre capacità finora associate soprattutto a modelli proprietari chiusi: prestazioni di frontier nel coding, una finestra di contesto di un milione di token e comprensione nativa di testo, immagini e video.
Il modello è distribuito in formato open-weight, con pesi scaricabili tramite Hugging Face e GitHub e disponibilità anche tramite API ufficiali MiniMax e provider terzi come OpenRouter e SiliconFlow. A differenza di molti modelli multimodali che aggiungono capacità visive in un secondo momento, M3 è stato addestrato fin dall'inizio su dati interallacciati di testo, immagine e video. MiniMax non ha reso pubblico il conteggio esatto dei parametri totali.
A cosa serve / dove eccelle
M3 è progettato per compiti che richiedono contesti molto ampi, ragionamento multi-step e interazione prolungata con strumenti. Le aree di eccellenza dichiarate sono tre: il software engineering su repository interi, i flussi di lavoro agentici autonomi e la comprensione di documenti o video di lunga durata.
Grazie alla finestra di un milione di token, il modello può mantenere in memoria intere code base, tracce di conversazione estese o sequenze di chiamate a strumenti senza perdere coerenza. La modalità nativamente multimodale consente di analizzare screenshot, diagrammi, video e documenti scansionati insieme al testo. MiniMax sottolinea inoltre prestazioni competitive in compiti di programmazione reale, ovvero la capacità di leggere codice esistente, individuare bug, applicare patch e verificarne il funzionamento attraverso test automatizzati.
