OLMo 2 (Ai2): LLM open source 7B/13B spiegato

Cos'è OLMo 2

OLMo 2 è una famiglia di modelli di linguaggio di grandi dimensioni (Large Language Models, LLM) sviluppata dall'Allen Institute for AI (Ai2), un centro di ricerca no-profit statunitense fondato da Paul Allen. È la seconda generazione del progetto OLMo (Open Language Model), pensato per offrire modelli linguistici completamente aperti: non solo i pesi finali, ma anche il codice di addestramento, i dataset, le ricette di post-training e i checkpoint intermedi.

A differenza dei modelli "open weight", che pubblicano solo i pesi senza rivelare dati e metodologie, OLMo 2 rende disponibile l'intero flusso di sviluppo. La famiglia principale annunciata da Ai2 comprende modelli base e istruiti da 7 e 13 miliardi di parametri, con versioni dedicate alla ricerca, al fine-tuning e all'uso conversazionale.

A cosa serve

OLMo 2 è un modello autoregressivo decoder-only: predice il token successivo partendo da un contesto dato, generando così testo coerente. Le varianti base sono adatte a chi vuole addestrare ulteriormente il modello su dati proprietari, fare ricerca sui meccanismi di apprendimento o costruire modelli verticalizzati. Le varianti Instruct, invece, sono state ottimizzate per seguire istruzioni, sostenere dialoghi multi-turn e rispondere in modo utile a richieste complesse.

Gli ambiti di applicazione spaziano dai chatbot aziendali agli assistenti virtuali, dagli strumenti di supporto alla scrittura all'analisi di documenti, dalla classificazione di testi alla generazione di snippet di codice, dall'estrazione di informazioni strutturate alla prototipazione di agenti intelligenti. La licenza permissiva Apache 2.0 consente l'uso commerciale senza royalty, rendendo il modello interessante anche per prodotti e servizi.

OLMo 2 (Ai2): LLM open source 7B/13B per ricerca e impresa

Cos'è OLMo 2

A cosa serve

Come funziona

🤔 Hai domande su questo argomento?

Continua a leggere

Veo 3 (Google): modello di generazione video AI con audio nativo

Stable Video Diffusion (Stability AI): image-to-video open

Perché conta per founder, PMI e agenzie italiane

Dove trovarlo

Sora (OpenAI): modello di generazione video da testo e immagini

Sana (NVIDIA): modello open di sintesi immagini ad alta risoluzione