TUTTO ciò che devi sapere su Gemma 3

Buone notizie per gli sviluppatori: Google ha lanciato Gemma 3, una nuova famiglia di modelli AI "open-source" per ora la più potente soluzione AI eseguibile su una singola GPU. L'obiettivo di Google è permettere agli sviluppatori di creare applicazioni AI in grado di funzionare su qualsiasi dispositivo.
Cos'è Gemma 3 e perché è importante
Gemma 3 - frutto della stessa tecnologia deitro a Gemini - segna il primo anniversario della famiglia di modelli Gemma (circa un anno fa venivano pubblicati Gemma 2 e Gemma 7B), che in soli 12 mesi ha raggiunto il traguardo di oltre 100 milioni di download e ha ispirato la creazione di più di 60.000 varianti da parte della community di sviluppatori, come riportato nel blog di Google.
La caratteristica principale di Gemma 3 è la sua capacità di funzionare efficacemente su una singola GPU o TPU (Tensor Processing Unit), offrendo prestazioni che - secondo Google - superano sul benchmark LMArena concorrenti che necessitano di molte più GPU (fino a 32), come Llama3-405B di Meta, DeepSeek-V3 e o3-mini.
Puoi approfondire le caratteristiche di Gemma 3 nel lungo report tecnico pubblicato da Google

"Gemma 3 delivers state-of-the-art performance for its size, outperforming Llama3-405B, DeepSeek-V3 and o3-mini in preliminary human preference evaluations on LMArena's leaderboard."
Dimensioni e varietà dei modelli
Gemma 3 è disponibile in diverse dimensioni per adattarsi a varie esigenze hardware e di prestazioni:
- 1B
- 4B
- 12B
- 27B
Caratteristiche di Gemma 3
🌍Supporto multilingue
Gemma 3 offre un supporto nativo per oltre 35 lingue e supporto pre-addestrato per più di 140 lingue, consentendo agli sviluppatori di creare applicazioni che possono comunicare nella lingua dei loro utenti a livello globale.
🎭Multimodalità
Gemma 3 può analizzare testi, immagini e brevi video. I modelli 4B, 12B e 27B supportano la visione, come specificato nel documento ufficiale.
🛤️Ampia finestra di contesto
Gemma 3 ha una finestra di contesto di 128.000 token, permettendo alle applicazioni di processare e comprendere grandi quantità di informazioni contemporaneamente.
🔧Function Calling e Output Strutturato
Il modello supporta il function calling (la funzione che dà a Gemma 3 la capacità di "premere pulsanti" in un programma) e output strutturato (grazie a cui l'AI può fornire risposte in formati predefiniti come JSON, XML, tabelle). Le due funzionalità aiutano ad automatizzare task e costruire esperienze "agentiche"
⚡Modelli quantizzati
Gemma 3 ha varie versioni quantizzate ufficiali, cioè versioni "compresse" del modello originale che usano meno memoria e potenza di calcolo e sono quindi più efficienti su dispositivi con risorse limitate
ShieldGemma 2: un dispositivo di sicurezza integrato
Insieme a Gemma 3, Google ha lanciato ShieldGemma 2, un checker di sicurezza per immagini. Questo strumento fornisce una soluzione pronta all'uso per la sicurezza delle immagini, producendo etichette di sicurezza in tre categorie:
- Contenuti pericolosi
- Contenuti sessualmente espliciti
- Violenza
ShieldGemma 2 è progettato per essere personalizzabile in base alle specifiche esigenze di sicurezza degli sviluppatori e degli utenti, sfruttando l'architettura di Gemma 3 per promuovere uno sviluppo responsabile dell'AI.
Integrazione e accessibilità
Google ha reso Gemma 3 facilmente integrabile in vari flussi di lavoro esistenti, tra cui:
- Framework popolari: Hugging Face Transformers, Ollama, JAX, Keras, PyTorch, Google AI Edge, UnSloth, vLLM e Gemma.cpp
- Sperimentazione immediata: accesso istantaneo attraverso Google AI Studio, Kaggle o Hugging Face
- Personalizzazione: include una codebase rinnovata con ricette per fine-tuning ed inferenza efficienti
- Opzioni di deployment flessibili: Vertex AI, Cloud Run, Google GenAI API, ambienti locali e altre piattaforme
Ottimizzazione per hardware diversi
Gemma 3 è stato ottimizzato per funzionare su diverse piattaforme hardware:
- GPU NVIDIA: dal Jetson Nano ai più recenti chip Blackwell
- Google Cloud TPU
- GPU AMD tramite lo stack open-source ROCm™
- CPU con Gemma.cpp
Il "Gemmaverse" e il programma accademico
Il lancio di Gemma 3 amplia ulteriormente il cosiddetto "Gemmaverse", l'ecosistema di modelli e strumenti creati dalla community. Alcuni esempi notevoli includono:
- SEA-LION v3 di AI Singapore: abbatte le barriere linguistiche nel Sud-Est asiatico
- BgGPT di INSAIT: un modello linguistico pionieristico focalizzato sulla lingua bulgara
- OmniAudio di Nexa AI: dimostra il potenziale dell'AI on-device per l'elaborazione audio avanzata
Per supportare la ricerca accademica, Google ha lanciato il Programma Accademico Gemma 3, che offre ai ricercatori la possibilità di richiedere crediti Google Cloud (del valore di $10.000 per premio) per accelerare la loro ricerca basata su Gemma 3.
Responsabilità e sicurezza
Google ha sottolineato l'importanza dello sviluppo responsabile di modelli AI open. Lo sviluppo di Gemma 3 ha incluso:
- Governance rigorosa dei dati
- Allineamento con le politiche di sicurezza di Google attraverso fine-tuning
- Valutazioni robuste tramite benchmark
Le prestazioni STEM avanzate di Gemma 3 hanno spinto Google a condurre valutazioni specifiche incentrate sul potenziale uso improprio nella creazione di sostanze dannose. I risultati indicano un livello di rischio basso.