Salta al contenuto principale

Lo stato dell'arte secondo l'AI Index Report 2025

ai index 2025

L'AI Index Report 2025 della Stanford University

Dove siamo? Chi siamo? Da dove veniamo? Ma soprattutto, a che punto siamo con l'AI? 

L'AI Index Report è un'utilissima pubblicazione annuale della Stanford University HAI (Human-centered Artificial Intelligence), che offre una panoramica completa dello stato dell'arte dell'AI attraverso dati concreti e analisi approfondite. Questa settimana l'università ha pubblicato l'AI Index del 2025: 456 pagine dense di analisi, grafici e dati sull'evoluzione dell'AI. Esaminiamo insieme i punti salienti di questo report per fare un po' di chiarezza sullo stato attuale delle nuove tecnologie.

da dove veniamo?

Il dominio USA e l'ascesa della Cina

Le aziende statunitensi mantengono un vantaggio competitivo nello sviluppo dei modelli AI. Nel 2024, ben 40 tra i modelli più importanti sono stati sviluppati negli Stati Uniti, superando i 15 della Cina e i soli 3 dell'Europa (tutti provenienti dalla Francia). Questo predominio è - ça va sans dire - frutto dell'elevata concentrazione di talenti e investimenti nel settore tech americano.

Tuttavia, il divario prestazionale tra i modelli americani e cinesi si sta riducendo rapidamente. Se a gennaio 2024 il modello statunitense più performante superava il miglior modello cinese del 9,26% nei benchmark di chatbot, a febbraio 2025 questo divario si è ridotto all'1,70%. Trend simili si riscontrano anche in altre aree come ragionamento, matematica e programmazione.

grafico_ai

I costi dell'AI

Il report illustra il "paradosso economico" dell'AI: da un lato i costi di addestramento dei modelli più avanzati continuano a salire vertiginosamente, dall'altro l'utilizzo quotidiano dell'AI diventa sempre più economicamente accessibile.

L'addestramento di modelli all'avanguardia richiede investimenti colossali. Il Gemini 1.0 Ultra di Google ha stabilito un nuovo record con costi stimati intorno ai 192 milioni di dollari. Questo trend al rialzo coincide con l'aumento del numero di parametri, dei tempi di addestramento e della quantità di dati utilizzati.

Allo stesso tempo, i costi di inferenza (l'utilizzo di modelli già addestrati) stanno crollando drasticamente. Il report indica che il costo per milione di token è sceso da 20 dollari a soli 0,07 dollari, mentre un'altra metrica mostra una riduzione da 15 a 0,12 dollari in meno di un anno. La direzione è dunque la tanto agognata e citatissima "democratizzazione dell'AI".

estimated_training_cost_AI_models

L'impronta di carbonio: un problema crescente

Nonostante i miglioramenti in termini di efficienza energetica, l'impronta di carbonio rappresenta una preoccupazione ambientale sempre più rilevante. Il report stima che l'addestramento del modello Llama 3.1 di Meta abbia emesso circa 8.930 tonnellate di CO₂, equivalenti all'impatto ambientale annuale di 496 cittadini americani.

Questo problema spiega perché molte aziende del settore stiano guardando con interesse all'energia nucleare come fonte affidabile di energia a basse emissioni di carbonio. 

estimated_carbon_emissions_ai

Benchmark saturi e nuove sfide

Il report mette in luce il fenomeno della "saturazione" di molti benchmark tradizionali utilizzati per valutare le capacità dei sistemi AI. In numerosi campi - dalla conoscenza generale al ragionamento sulle immagini, dalla matematica alla programmazione - i modelli AI ottengono ormai punteggi talmente elevati che i test non risultano più discriminanti.

Di conseguenza, i ricercatori stanno sviluppando nuovi benchmark più impegnativi, come "Humanity's Last Exam", che raccoglie domande estremamente complesse formulate da esperti provenienti da 500 istituzioni in tutto il mondo. Anche i modelli più avanzati faticano con questo test: il modello di ragionamento o1 di OpenAI ha ottenuto il punteggio più alto finora, rispondendo correttamente solo all'8,8% delle domande.

humanity_last_exam

L'accesso ai "data commons"

I sistemi attuali di AI generativa  acquisiscono le loro capacità attraverso l'addestramento su enormi quantità di dati raccolti da Internet. Tuttavia, le restrizioni all'accesso ai dati stanno aumentando: il 48% dei dati provenienti dai domini web più importanti è ora completamente limitato all'accesso tramite crawler, secondo quanto riportato nel robot.txt dei siti. Questa tendenza potrebbe limitare la crescita dei modelli AI, spingendo i ricercatori a sviluppare approcci che richiedano meno dati o a trovare nuove fonti di informazione.

data_commons_ai

Investimenti aziendali in crescita, ROI ancora da dimostrare

Il mondo aziendale ha aumentato notevolmente i finanziamenti per l'AI negli ultimi cinque anni. Nel 2024, gli investimenti privati globali hanno raggiunto i 150 miliardi di dollari, di cui circa 33 miliardi destinati all'IA generativa.

Nonostante questo entusiasmo finanziario, il ritorno sull'investimento rimane modesto (ROI) per la maggior parte delle aziende. Secondo un sondaggio di McKinsey citato nel report, la maggior parte delle aziende che hanno implementato soluzioni AI ha registrato riduzioni dei costi inferiori al 10% e aumenti di ricavi inferiori al 5%.

corporate_investment_ai

L'IA nella scienza e medicina

Importantissima è l'applicazione dell'AI nel settore sanitario. Il report menziona una quantità di nuovi modelli sviluppati per supportare i ricercatori nei campi della scienza dei materiali, delle previsioni meteorologiche e del calcolo quantistico. Inoltre, molte aziende stanno tentando di sfruttare le capacità predittive e generative dell'AI per lo sviluppo di farmaci.

Un dato interessante emerge da uno studio del 2024 che ha testato se i medici potessero migliorare l'accuratezza delle loro diagnosi utilizzando GPT-4 oltre alle loro risorse tradizionali. I risultati non hanno mostrato miglioramenti significativi, e sorprendentemente, GPT-4 da solo ha superato sia i team uomo-AI che i soli medici.

AI_diagnosi_cliniche

Regolamentazione: più parole che azioni a livello federale

Nel campo della regolamentazione, il report mostra che negli Stati Uniti c'è stato un acceso dibattito interno al Congresso, ma poca azione concreta a livello federale. L'attività normativa si è spostata principalmente a livello statale, dove sono state approvate 131 leggi nel 2024, di cui 56 relative ai deepfake.

In Europa, l'AI Act rappresenta un importante tentativo di regolamentazione, che impone nuovi obblighi alle aziende sviluppatrici di modelli AI considerati ad alto rischio. A livello globale, la tendenza principale è stata quella di formulare dichiarazioni generali e non vincolanti sul ruolo che l'AI dovrebbe svolgere nel mondo.

leggi_ai_usa

L'ottimismo umano di fronte all'AI

Nonostante il diffuso timore sulla possibilità che l'AI  possa sostituire posti di lavoro, la maggioranza delle persone non si sente minacciata dalla tecnologia. Secondo un recente sondaggio globale, mentre il 60% degli intervistati provenienti da 32 paesi ritiene che l'AI cambierà il loro modo di lavorare, solo il 36% si aspetta di essere sostituito.

ai_lavoro

Conclusioni: Dove siamo? 

Il report AI Index 2025 di Stanford dipinge il quadro di un'AI che si evolve a ritmi impressionanti, con miglioramenti costanti nelle capacità tecniche e una crescente integrazione in vari settori dell'economia e della società. Tuttavia, persistono sfide significative legate alla sostenibilità ambientale, all'accesso ai dati di addestramento, e alla traduzione delle capacità tecniche in benefici economici concreti. La regolamentazione rimane frammentata, con approcci diversi in diverse giurisdizioni.

Per noi di Intellygenza, questi dati confermano l'importanza di un approccio consapevole all'AI, che ne sfrutti il potenziale mantenendo al contempo un'attenzione alle implicazioni etiche, ambientali e sociali. Continueremo a seguire questi sviluppi e a fornirvi analisi sulle tendenze più rilevanti nel mondo dell'intelligenza artificiale.

Ti è piaciuto questo articolo? Non perdere i nostri approfondimenti sull'AI. Iscriviti alla nostra newsletter per ricevere aggiornamenti futuri.

Grazie per il tuo tempo, dallo staff di Intellygenza 💡