Riappare GPT selvatico (e conosce il siciliano)
In un articolo uscito venerdì scorso abbiamo presentato "gpt2-chatbot", un misterioso e potente modello di AI apparso su LMSYS Org e scomparso dopo pochissimi giorni. Da lunedì gpt2 è tornato nuovamente disponibile sulla piattaforma in una duplice forma e sembra essere addirittura più performante di GPT-4 (e conoscere il siciliano). Ma andiamo con ordine.
LMSYS Org è la principale piattaforma di benchmark dei modelli AI. Al suo interno, gli utenti possono confrontare e valutare le risposte dei chatbot, sottomettendogli lo stesso prompt, per individuare il modello migliore.
Lunedì sera, il precedentemente scomparso gpt2 è tornato sulla piattaforma in due varianti: “im-a-good-gpt2-chatbot” e “im-also-a-good-gpt2-chatbot”. Questi modelli sono ancora più sfuggenti del primo gpt2-chatbot. Infatti, la maggior parte dei modelli presenti su LMSYS può essere selezionata da un menù a tendina, ma non i due gpt. L'unico modo per accedervi è procedere per tentativi nella Chatbot Arena di LMSYS, dove è possibile inserire un prompt a cui soltanto due fra la quarantina di modelli disponibili potranno rispondere. Con un po' di fortuna uno di questi sarà uno dei modelli gpt2 sperati: potete provare qui.
Ancora una volta, la comunità dell'AI si è scatenata, testando la potenza dei gpt2 e speculando sulle loro origini. In suo soccorso è però venuto l'ennesimo post di Sam Altman, CEO di OpenAI, che ha twittato “im-a-good-gpt2-chatbot” il giorno precedente alla ricomparsa del modello:
Per molti, questa è una conferma del fatto che OpenAI sta testando nuovi modelli. LMSYS Org, infatti, lavora solo con i principali sviluppatori di AI, ed è solita fornire loro servizi di test anonimi. La teoria più diffusa su Reddit è che gpt2-chatbot sia un vecchio modello di OpenAI, potenziato però da un'architettura di AI avanzata. Tuttavia, si tratta solo di speculazioni e non è ancora certo che questi modelli di IA provengano da OpenAI.
Secondo quanto riferito da The Information, OpenAI avrebbe programmato un evento presso la sede dell'azienda giovedì per presentare dimostrazioni del prodotto e condividere gli aggiornamenti. Tuttavia, il report afferma che l'azienda sta valutando di rimandare l'evento, il cui tema rimane non identificato. Inoltre, Altman, ha detto in un suo intervento all'Università di Harvard che gpt2-chatbot non è GPT-4.5. Tuttavia, il CEO non ha chiarito se si trattasse o meno di un prodotto OpenAI.
In ogni caso, "im-a-good-gpt2-chatbot” e “im-also-a-good-gpt2-chatbot” sembrano essere due modelli avanzati e potenti, probabilmente migliori di GPT-4, come sostenuto da numerosi utenti su X
Noi di Intellygenza abbiamo provato a chiedere ai modelli su LMSYS di tradurre le tre leggi della robotica di Asimov in siciliano. Il risultato è che, sorprendentemente, "im-a-good-gpt2-chatbot" sembra conoscere il dialetto siciliano, e ha tradotto il testo meglio di "llama-3b-70b-instruct" di Meta.
La traduzione delle leggi di Asimov in siciliano. A sinistra: Llama; a destra: im-a-good-gpt2-chatbotFonti: Quartz; The Information; Axios.