Lun. Ago 18th, 2025

L’ultima versione dell’acclamato bot ChatGPT di OpenAI avrebbe dovuto avere un’intelligenza di livello “dottorato”. Prometteva di essere il prossimo grande salto per un’azienda in cui gli investitori hanno investito miliardi di dollari. Invece, ChatGPT ha ottenuto una personalità più piatta e concisa che non è in grado di rispondere in modo affidabile a domande di base. Il conseguente scherno pubblico ha costretto l’azienda a scusarsi, pur mantenendo le sue pretenziose affermazioni sulle capacità del bot.

In breve: è un fallimento

L’errore del modello, chiamato GPT-5, è notevole per un paio di motivi:

  1. Ha messo in evidenza le numerose carenze esistenti dell’IA generativa, che i critici non hanno tardato a sfruttare (ne parleremo tra un attimo, perché sono stati piuttosto divertenti).
  2. Ha sollevato seri dubbi sulla capacità di OpenAI di creare e commercializzare prodotti di consumo che gli esseri umani siano disposti a pagare. Ciò dovrebbe essere particolarmente preoccupante per gli investitori, dato che OpenAI, che non ha mai realizzato profitti, ha un valore stimato di 500 miliardi di dollari.

Torniamo indietro a giovedì scorso, quando OpenAI ha finalmente lanciato GPT-5, con circa un anno di ritardo rispetto al previsto, secondo il Wall Street Journal. Ora, una cosa in cui questo settore è davvero bravo è creare aspettative, e in questo senso il suo CEO, Sam Altman, ha mantenuto le promesse.

Durante una trasmissione in diretta prima del lancio giovedì scorso, Altman ha detto che parlare con GPT-5 sarebbe come parlare con “un esperto con un dottorato in qualsiasi cosa, in qualsiasi campo tu abbia bisogno”.

Con il suo solito stile arrogante, Altman ha detto che GPT-5 gli ricorda “quando l’iPhone è passato da quei vecchi modelli con pixel giganti allo schermo retina”. Il nuovo modello, ha detto, è “significativamente migliore sia negli aspetti ovvi che in quelli più sottili, e sento che è qualcosa a cui non vorrei mai tornare indietro”, ha detto Altman in una conferenza stampa.

Poi la gente ha iniziato a usarlo davvero

Gli utenti si sono divertiti molto a provare GPT-5 e a prendere in giro le sue risposte completamente sbagliate.

Il giornalista Tim Burke ha detto di aver chiesto a GPT-5 di “mostrare un diagramma dei primi 12 presidenti degli Stati Uniti con un’immagine del loro volto e il loro nome sotto l’immagine”.

Il bot ha restituito invece un’immagine di nove persone, con un’ortografia piuttosto creativa dei primi leader americani, come “Gearge Washingion” e “William Henry Harrtson”.

Una richiesta simile per gli ultimi 12 presidenti ha restituito un’immagine che includeva due versioni diverse di George W. Bush. Ma non George H. W. Bush e suo figlio George W. Bish; bensì un certo “George H. Bush” e poi suo figlio… due volte. Solo che la seconda volta, George Jr. era molto diverso dal 43° presidente.

GPT-5 ha fatto un po’ meglio quando mercoledì gli ho chiesto una mappa degli Stati Uniti.

Alcune persone, infatti, sono in grado di identificare correttamente il grande stato del Vermont senza un dottorato, ma non GPT-5. E questa è la prima volta che sento parlare di stati chiamati “Yirginia”.

Le risposte fornite da GPT-5 erano divertenti quando eravamo solo noi nerd a cercare di trovare i suoi punti deboli. Ma alcuni utenti abituali di ChatGPT non ridevano. Soprattutto perché gli utenti sono stati particolarmente allarmati dalla personalità della nuova versione, o meglio, dalla sua mancanza.

Con il lancio del nuovo modello, OpenAI ha sostanzialmente ritirato i suoi modelli precedenti, compreso il popolarissimo GPT-4o, presente sul mercato da oltre un anno.

Questo ha fatto sì che anche chi amava la versione precedente del chatbot improvvisamente non potesse più utilizzarlo. Più di 4.000 persone hanno firmato una petizione su Change.org per costringere OpenAI a ripristinarlo.

“Ne ho abbastanza di ChatGPT 5”, ha scritto un utente su Reddit, spiegando come ha cercato di utilizzare il nuovo modello per eseguire “un semplice sistema” di attività che un modello precedente di ChatGPT era in grado di gestire. L’utente ha detto che GPT-5 “è impazzito”, eliminando attività e spostando le scadenze. E anche se i sostenitori di OpenAI potrebbero attribuire questo fatto a un incidente isolato o addirittura inventato, in meno di 24 ore dal lancio di GPT-5, Altman stava già cercando di limitare i danni, apparentemente sorpreso dalla cattiva accoglienza. Su X, ha annunciato una lunga lista di aggiornamenti, tra cui il ritorno di GPT-4o per gli abbonati a pagamento.

“Ci aspettavamo qualche inconveniente nel lanciare così tante cose contemporaneamente”, ha detto Altman in un post. “Ma è stato un po’ più accidentato di quanto ci aspettassimo!”

L’incapacità del CEO di anticipare l’indignazione suggerisce che non ha un controllo saldo su come i circa 700 milioni di utenti attivi settimanali interagiscono con il suo prodotto.

Forse Altman ha ignorato tutta la copertura mediatica – da CNN, The New York Times, The Wall Street Journal – sulle persone che hanno sviluppato un profondo legame con ChatGPT o altri chatbot rivali, intrattenendo conversazioni infinite con loro come se fossero persone reali. Una semplice ricerca su Reddit avrebbe potuto offrire spunti su come altri stanno integrando lo strumento nel loro flusso di lavoro e nella loro vita. Una semplice ricerca di mercato avrebbe dovuto mostrare a OpenAI che un aggiornamento massiccio che avrebbe interrotto gli strumenti da cui le persone dipendono sarebbe stato più di un piccolo inconveniente.

Alla domanda sulla reazione negativa a GPT-5, un rappresentante di OpenAI ha rimandato la CNN alle dichiarazioni pubbliche di Altman sui social media che annunciavano il ritorno dei vecchi modelli, nonché a un post sul blog su come l’azienda sta ottimizzando GPT-5.

Il lancio caotico mostra come l’industria dell’IA nel suo complesso stia lottando per dimostrare di essere un produttore di beni di consumo piuttosto che un “laboratorio”, come ama definirsi, perché suona più scientifico e distrae l’attenzione dal fatto che è sostenuta da persone che cercano di guadagnare somme di denaro inimmaginabili.

Le aziende di IA tendono a basare la loro arroganza sulle prestazioni di un modello in vari test di riferimento interni che dimostrano quanto un bot sia in grado di eseguire calcoli complessi. Da quanto ne sappiamo, GPT-5 ha superato tali valutazioni.

Il problema è che OpenAI ha promosso il prodotto a tal punto che la delusione era (o avrebbe dovuto essere) inevitabile. “Onestamente, non pensavo che OpenAI avrebbe bruciato il nome del marchio con qualcosa di così mediocre”, ha scritto il noto ricercatore e critico di IA Gary Marcus. “In un mondo razionale, il suo valore sarebbe crollato”, ha aggiunto, sottolineando che OpenAI non ha ancora realizzato profitti, sta riducendo i prezzi per mantenere il numero di utenti e sta perdendo talenti con l’aumentare della concorrenza.

Come ha sottolineato in un post sul blog, altri modelli come Grok di Elon Musk non stanno ottenendo risultati molto migliori, e la reazione negativa anche da parte dei sostenitori dell’IA è percepita come un punto di svolta.

Quando si parla di IA, si parla di una delle due cose: l’IA che abbiamo ora (chatbot con un’utilità limitata e definita) e l’IA che aziende come Altman affermano di poter costruire: macchine che possono essere più intelligenti degli esseri umani e dirci come curare il cancro, risolvere il riscaldamento globale, guidare le nostre auto e coltivare il nostro cibo, il tutto intrattenendoci e deliziandoci nel processo.

Ma il divario tra la promessa e la realtà dell’IA sembra ampliarsi con ogni nuovo modello.