MiniMax M3: modello AI open-weight con 1 milione di token di

Cos'è

MiniMax M3 è un modello fondazionale multimodale rilasciato il 1° giugno 2026 da MiniMax, laboratorio di intelligenza artificiale con sede a Shanghai. Si colloca come successore della serie M2 — in particolare di MiniMax-M2.7 — e viene posizionato come il primo modello open-weight a combinare in un'unica architettura tre capacità finora associate soprattutto a modelli proprietari chiusi: prestazioni di frontier nel coding, una finestra di contesto di un milione di token e comprensione nativa di testo, immagini e video.

Il modello è distribuito in formato open-weight, con pesi scaricabili tramite Hugging Face e GitHub e disponibilità anche tramite API ufficiali MiniMax e provider terzi come OpenRouter e SiliconFlow. A differenza di molti modelli multimodali che aggiungono capacità visive in un secondo momento, M3 è stato addestrato fin dall'inizio su dati interallacciati di testo, immagine e video. MiniMax non ha reso pubblico il conteggio esatto dei parametri totali.

A cosa serve / dove eccelle

M3 è progettato per compiti che richiedono contesti molto ampi, ragionamento multi-step e interazione prolungata con strumenti. Le aree di eccellenza dichiarate sono tre: il software engineering su repository interi, i flussi di lavoro agentici autonomi e la comprensione di documenti o video di lunga durata.

Grazie alla finestra di un milione di token, il modello può mantenere in memoria intere code base, tracce di conversazione estese o sequenze di chiamate a strumenti senza perdere coerenza. La modalità nativamente multimodale consente di analizzare screenshot, diagrammi, video e documenti scansionati insieme al testo. MiniMax sottolinea inoltre prestazioni competitive in compiti di programmazione reale, ovvero la capacità di leggere codice esistente, individuare bug, applicare patch e verificarne il funzionamento attraverso test automatizzati.

Caratteristica	Dettaglio
Sviluppatore	MiniMax (Shanghai Hixi Technology / Xiyu Technology)
Data di rilascio	1° giugno 2026 (API attive dal 31 maggio 2026)
Architettura	Mixture-of-Experts con MiniMax Sparse Attention (MSA)
Finestra di contesto	Fino a 1 milione di token; minimo garantito 512.000 token
Modalità di input	Testo, immagini, video
Modalità di output	Testo
Distribuzione	Open-weight (Hugging Face, GitHub) e API commerciale
Varianti API	M3 e M3-highspeed (risultati equivalenti, inferenza più rapida)

MiniMax M3: modello AI open-weight con 1 milione di token di contesto

Cos'è

A cosa serve / dove eccelle

🤔 Hai domande su questo argomento?

Continua a leggere

Qwen3-Embedding: embedding testuali multilingui open source di Alibaba Cloud

SmolLM3: scheda del modello di linguaggio compatto di Hugging Face

Caratteristiche e specifiche

Punti di forza

Quando ha senso (e quando no)

Casi d'uso concreti

Alternative e contesto

In sintesi

Risorse

Moondream: famiglia di Vision-Language Model open source efficienti

Kokoro TTS: modello open-weight di sintesi vocale da 82M parametri