Creare siti web con l'AI
L'AI sembra essere sempre più brava a realizzare siti web. Ma quale modello scegliere fra i trilioni di intelligenze artificiali esistenti? Proprio per rispondere a questa domanda, LMArena ha creato WebDev Arena, una piattaforma che classifica i modelli AI in base alla loro capacità di programmazione web.
Cos'è WebDev Arena?
WebDev Arena è una piattaforma open-source sviluppata da LMArena, prima conosciuta come LMSYS Org. Quest'ultima è una piattaforma di benchmark conosciuta per Chatbot Arena, che valuta e classifica i chatbot più famosi, come Claude o Chat GPT. Recentemente, la piattaforma ha aggiunto anche WebDev Arena, una classifica sperata che mette in competizione i diversi modelli AI nella programmazione web. Gli utenti possono osservare i risultati in tempo reale, votare le migliori soluzioni e consultare la classifica dei modelli più performanti. Dal momento che la classifica è il semplice risultato dell'insieme voti di una moltitudine di utenti volontari, la piattaforma offre un modo trasparente per confrontare le capacità di diversi LLM.
Come funziona WebDev Arena?
Dall'interfaccia principale, l'utente può esprimere la propria richiesta tramite prompt (es. crea un gioco di scacchi online, clona un editor di codice come VS Code, realizza una dashboard per metriche aziendali).

Successivamente, due diversi sistemi di intelligenza artificiale svilupperanno l'applicazione o il sito web richiesto. La piattaforma inviterà quindi l'utente - che non sa quali modelli sta valutando - a decidere quale dei due risultati sia più soddisfacente, con la possibilità di segnalare un pareggio o l'insoddisfazione per entrambi gli output.
La classifica attuale
WebDev Arena testa un’ampia gamma di modelli AI. Ecco la classifica attuale:

Sorprendentemente, Claude 3.7 Sonnet e 3.5 Sonnet - i due modelli più avanzati di Anthropic - sono in cima alla classifica, nelle prime due posizioni: DeepSeek R1, Grok 3 e GPT o3-mini - tutti modelli rilasciati di recente - non hanno ancora superato il "vecchio" - ma sempre affidabile - Claude 3.5 Sonnet.
🔗 Per scoprire di più e provare WebDev Arena, visita: webdev.lmarena.ai