Cos'è OLMo 2
OLMo 2 è una famiglia di modelli di linguaggio di grandi dimensioni (Large Language Models, LLM) sviluppata dall'Allen Institute for AI (Ai2), un centro di ricerca no-profit statunitense fondato da Paul Allen. È la seconda generazione del progetto OLMo (Open Language Model), pensato per offrire modelli linguistici completamente aperti: non solo i pesi finali, ma anche il codice di addestramento, i dataset, le ricette di post-training e i checkpoint intermedi.
A differenza dei modelli "open weight", che pubblicano solo i pesi senza rivelare dati e metodologie, OLMo 2 rende disponibile l'intero flusso di sviluppo. La famiglia principale annunciata da Ai2 comprende modelli base e istruiti da 7 e 13 miliardi di parametri, con versioni dedicate alla ricerca, al fine-tuning e all'uso conversazionale.
A cosa serve
OLMo 2 è un modello autoregressivo decoder-only: predice il token successivo partendo da un contesto dato, generando così testo coerente. Le varianti base sono adatte a chi vuole addestrare ulteriormente il modello su dati proprietari, fare ricerca sui meccanismi di apprendimento o costruire modelli verticalizzati. Le varianti Instruct, invece, sono state ottimizzate per seguire istruzioni, sostenere dialoghi multi-turn e rispondere in modo utile a richieste complesse.
Gli ambiti di applicazione spaziano dai chatbot aziendali agli assistenti virtuali, dagli strumenti di supporto alla scrittura all'analisi di documenti, dalla classificazione di testi alla generazione di snippet di codice, dall'estrazione di informazioni strutturate alla prototipazione di agenti intelligenti. La licenza permissiva Apache 2.0 consente l'uso commerciale senza royalty, rendendo il modello interessante anche per prodotti e servizi.
