Cos'è
Liquid LFM2 è una famiglia di modelli fondativi linguistici sviluppata da Liquid AI, startup con sede a Cambridge (Massachusetts) fondata da ricercatori del MIT CSAIL. Rilasciata a partire dal 2025, rappresenta la seconda generazione dei Liquid Foundation Models (LFM) ed è progettata per offrire buone capacità di ragionamento e generazione testuale mantenendo un'impronta computazionale ridotta, in modo da girare su dispositivi locali piuttosto che solo su cloud.
A differenza dei grandi modelli densi che privilegiano la massima capacità a scapito di costi e latenza, LFM2 punta all'efficienza on-device: smartphone, laptop, AI PC, dispositivi IoT e robot. L'obiettivo dichiarato è bilanciare qualità, latenza e consumo di memoria per carichi di lavoro edge e agenti locali.
La famiglia comprende varianti dense da 350 milioni, 700 milioni, 1,2 miliardi e 2,6 miliardi di parametri, una variante mixture-of-experts (MoE) da 8,3 miliardi di parametri totali (1,5 miliardi attivi per token) e, dal febbraio 2026, il modello LFM2-24B-A2B con 24 miliardi di parametri totali e circa 2 miliardi attivi. Sono inoltre disponibili varianti specializzate: LFM2-VL per compiti visione-linguaggio, LFM2-Audio per l'audio, LFM2-ColBERT per il retrieval e modelli ottimizzati per estrazione dati o riassunti di trascrizioni.
A cosa serve / dove eccelle
LFM2 è pensato per scenari in cui l'inferenza locale è preferibile o necessaria: bassa latenza, assenza di connessione, privacy dei dati e contenimento dei costi operativi. L'architettura ibrida e la ricerca architetturale "hardware-in-the-loop" mirano a ottenere prestazioni competitive su CPU, GPU e NPU consumer.
Secondo i benchmark pubblicati da Liquid AI, LFM2-2.6B raggiunge il 79,56% su IFEval (seguimento istruzioni) e l'82,41% su GSM8K (ragionamento matematico), piazzandosi tra i modelli più competitivi nella fascia 3B di parametri. Il checkpoint sperimentale LFM2-2.6B-Exp, pubblicato a dicembre 2025, utilizza un post-addestramento basato esclusivamente su reinforcement learning (RL) e ha mostrato ulteriori miglioramenti, in particolare su IFBench, un benchmark di seguimento istruzioni complesse, dove ha superato modelli di gran lunga più grandi come DeepSeek R1-0528. Le prime segnalazioni indicano per l'Exp punteggi superiori all'88% su IFEval e circa il 42% su GPQA (domande a livello universitario avanzato), anche se questi ultimi valori meritano verifica indipendente.
