
27 Apr GPT-5.5 e Claude Mythos: i Due Modelli AI che Stanno Ridefinendo il Settore nel 2026
Due annunci in due settimane
Il mese di aprile 2026 rimarrà probabilmente negli annali dell’AI come uno dei più densi di novità degli ultimi anni. Il 7 aprile Anthropic ha rilasciato Claude Mythos Preview — un modello che l’azienda ha deciso di non rendere pubblicamente disponibile per ragioni di sicurezza informatica. Il 23 aprile OpenAI ha risposto con GPT-5.5, il suo modello più avanzato in assoluto, disponibile per tutti gli abbonati paganti. Due approcci completamente diversi, due filosofie di rilascio agli antipodi, e un benchmark comune su cui si sono sfidati. Proviamo a capire cosa è successo davvero.
GPT-5.5: cosa fa che gli altri non fanno
GPT-5.5 è stato annunciato da OpenAI il 23 aprile 2026 (OpenAI, annuncio ufficiale) e definito internamente con il nome in codice “Spud” — una patata, sì. Il presidente Greg Brockman lo ha presentato come “una nuova classe di intelligenza per il lavoro reale” e come un passo concreto verso il concetto di super app che OpenAI ha in mente: un’unica interfaccia che unifica ChatGPT, Codex e un browser AI in un solo strumento per i clienti enterprise.
La novità più sostanziale non riguarda i benchmark astratti ma il comportamento sui task multi-step. GPT-5.5 riceve un’istruzione vaga e articolata — “analizza questo codebase, trova il bug, scrivi il fix, aggiorna la documentazione e apri una PR” — e la porta avanti in autonomia senza richiedere prompt intermedi (TechCrunch, 23 aprile 2026). OpenAI la chiama capacità “agentica”: l’AI pianifica, usa strumenti, controlla il proprio lavoro, naviga l’ambiguità e va avanti. I miglioramenti più marcati riguardano coding, computer use, knowledge work e ricerca scientifica preliminare.
Sul lato economico, GPT-5.5 è circa il doppio più costoso di GPT-5.4 via API — 5 dollari per milione di token in input e 30 dollari per milione in output. OpenAI sostiene che l’efficienza migliorata compensa il prezzo più alto su task complessi. La versione GPT-5.5 Pro, disponibile per gli abbonati ai piani Pro e superiori, è ottimizzata per problemi ad alta difficoltà con miglioramenti di latenza che la rendono “molto più pratica per task impegnativi”, come ha scritto OpenAI nel comunicato di lancio. ChatGPT conta oltre 900 milioni di utenti attivi settimanali e 50 milioni di abbonati (Fortune, 23 aprile 2026).
Claude Mythos Preview: il modello che Anthropic non vuole rilasciare
Claude Mythos Preview è una storia diversa e più complicata. Annunciato ufficialmente l’8 aprile 2026 dopo essere trapelato per un errore di configurazione CMS a fine marzo, Mythos non è disponibile al pubblico (InfoQ, aprile 2026). Anthropic ha scelto di limitarne l’accesso a un consorzio di aziende tecnologiche attraverso Project Glasswing, un’iniziativa da 100 milioni di dollari in crediti di utilizzo destinata a usare il modello per trovare e correggere vulnerabilità nel software critico.
Il motivo del blocco è esplicitato senza giri di parole nel blog di sicurezza di Anthropic: durante i test interni, Mythos Preview ha scoperto e sfruttato autonomamente zero-day vulnerabilities in tutti i principali sistemi operativi e browser. La più vecchia era un bug in OpenBSD rimasto non rilevato per 27 anni. Un’altra aveva 16 anni ed era nascosta nel codec H.264 di FFmpeg (Built In, aprile 2026). Anthropic ha valutato che rilasciare un modello con queste capacità al pubblico generale avrebbe creato rischi inaccettabili prima che le difese fossero pronte.
Sul piano delle capacità generali, Mythos è un salto significativo rispetto a Opus 4.6: SWE-bench a 93,9% (contro l’80,8% di Opus 4.6), USAMO a 97,6%, miglioramenti drammatici su coding, ragionamento e ricerca autonoma (Claude Mythos Archive & Analysis). Non è un aggiornamento dell’Opus — Anthropic lo ha posizionato come un nuovo livello di modello, più grande e più intelligente della serie Opus. Il nome in codice interno era Capybara, per chi tiene traccia di queste cose.
Come si confrontano sui benchmark comuni
Il confronto diretto tra GPT-5.5 e Claude Mythos Preview è complicato dal fatto che Mythos non è disponibile al pubblico e i benchmark indipendenti sono limitati. Su Terminal-Bench 2.0 — un benchmark per task agentico su terminale — GPT-5.5 ha superato Mythos Preview di un margine minimo, sostanzialmente un pareggio statistico (VentureBeat, 24 aprile 2026). Il che è notevole: GPT-5.5 è un modello in distribuzione pubblica, Mythos è un preview ristretto costruito con focus sulla cybersecurity. La gara è aperta.
Dal punto di vista di un developer o di un’agenzia web, il messaggio pratico è questo: GPT-5.5 è disponibile oggi su ChatGPT Plus in poi e tramite API, con miglioramenti concreti su task di coding complessi e lavoro multi-step. Claude Mythos Preview è accessibile solo per organizzazioni selezionate con focus sulla sicurezza informatica. Per la maggior parte degli usi professionali, GPT-5.5 è la novità rilevante di questa settimana. Mythos è la promessa di quello che arriverà quando i tempi saranno maturi per un rilascio generale.
Cosa cambia per chi usa questi strumenti ogni giorno
La vera domanda non è quale modello vince i benchmark — è cosa cambia nel lavoro quotidiano. GPT-5.5 con Codex ora può interagire con web app, cliccare attraverso pagine, catturare screenshot e iterare su quello che vede per completare task nel browser in modo autonomo. Per un developer che passa ore a testare manualmente flussi di navigazione o a fare code review, questo è un cambio concreto di produttività.
Per le agenzie web, la direzione che emergono da questi due rilasci è chiara: i modelli AI stanno diventando agenti che completano processi interi, non assistenti che rispondono a domande singole. Chi inizia a costruire workflow con questa mentalità oggi — delegando all’AI i task ripetitivi e multi-step mentre si concentra sulle decisioni strategiche — è in una posizione molto migliore rispetto a chi aspetta che la tecnologia si stabilizzi ulteriormente.