Argomenti trattati
Anthropic ha reso disponibile al pubblico il nuovo Claude Opus 4.7, un aggiornamento focalizzato sul lavoro autonomo e sull’ingegneria del software. Il rilascio, annunciato il 16 aprile 2026, porta modifiche significative nella capacità di visione, nella gestione della memoria contestuale e nelle prestazioni sui benchmark specialistici. Per team e sviluppatori la novità richiede una revisione delle strategie di prompting e dei flussi agentici per sfruttare al meglio le novità senza incorrere in costi imprevisti.
Nel breve termine molte squadre hanno notato comportamenti diversi rispetto a Opus 4.6: il modello risponde in modo più letterale alle istruzioni e può consumare più token per lo stesso input. Queste variazioni sono il risultato di scelte progettuali mirate a migliorare l’affidabilità e il rigore nei task complessi come il coding e l’analisi finanziaria. La disponibilità via API e sulle principali piattaforme cloud rende però l’adozione pratica, a patto di adattare prompt e parametri operativi.
Prestazioni e confronti con la concorrenza
Su benchmark dedicati alla programmazione il nuovo modello ottiene risultati significativamente migliori: nel test SWE-bench Verified raggiunge l’87,6% rispetto all’80,8% di Opus 4.6, e mostra progressi anche nelle versioni Pro del benchmark. Anthropic segnala che Opus 4.7 supera modelli concorrenti come GPT-5.4 e Gemini 3.1 Pro in categorie legate all’interazione con strumenti e all’automazione di compiti su computer, rendendolo più indicato per flussi agentici avanzati e per attività di refactor o generazione di codice non banale.
Benchmark sul coding e sulla finanza
I miglioramenti non si limitano al codice: nella modellizzazione economica il modulo General Finance scala a 0,813, contro lo 0,767 della release precedente, segnalando un comportamento più rigoroso nell’analisi quantitativa. Questo progresso rende il modello più affidabile per scenari che richiedono precisione nei calcoli e nella valutazione di scenari finanziari complessi, ma richiede anche una maggiore attenzione al consumo di token quando si eseguono simulazioni lunghe o backtest estesi.
Cosa cambia per chi costruisce prompt e agenti
Opus 4.7 introduce modifiche API e comportamentali che possono generare errori se non affrontate. Alcuni parametri tradizionali non sono più accettati: ad esempio, impostazioni come temperature, top_p e top_k vengono rifiutate, mentre la vecchia opzione di extended thinking è stata rimossa a favore di un meccanismo di adaptive thinking. Il risultato è un’architettura che dà maggiore controllo interno al modello, ma che costringe gli sviluppatori a ripensare lo scaffolding usato con le versioni precedenti.
Livelli di effort e gestione dei token
Il parametro effort diventa centrale per decidere qualità e spesa: gli stati possibili vanno da flow a xhigh, con raccomandazioni ufficiali di partire da xhigh per coding e casi agentici complessi. In parallelo sono stati introdotti i task budgets in beta, che permettono di assegnare un plafond di token (ad esempio 128k) per l’intero loop agentico. Questa funzione aiuta a contenere i costi nelle esecuzioni lunghe, ma attenzione: il tokenizer aggiornato può usare fino a 1,35 volte più token rispetto a prima, quindi i budget vanno calibrati con test reali.
Visione, strumenti integrati e sicurezza
Dal punto di vista della percezione, Opus 4.7 porta la risoluzione massima immagini a 2576 pixel sul lato lungo, triplicando la definizione utile per leggere dettagli in screenshot, grafici e interfacce. La mappatura 1:1 dei pixel semplifica operazioni come il posizionamento di bounding box o la misura di spaziature UI. Anthropic ha inoltre introdotto strumenti professionali come /ultrareview in Claude Code, che abilita sessioni multi-agente per scovare bug e problemi di design a livello collaborativo.
La società mantiene la finestra contestuale a 1 milione di token e conferma la struttura di prezzo: 5 dollari per milione di token in ingresso e 25 dollari per milione in uscita. Sono state aggiunte contromisure automatiche per ridurre usi ad alto rischio in ambito sicurezza informatica e migliorata la resistenza alla generazione di contenuti dannosi. Il modello è accessibile tramite l’API Claude e attraverso piattaforme cloud come Amazon Bedrock, Google Vertex AI e Microsoft Foundry.
In conclusione, Claude Opus 4.7 offre un significativo aumento di capacità per i flussi agentici e per compiti specialistici, ma impone aggiornamenti ai prompt, la verifica dei costi token e l’adozione delle nuove leve come effort e task_budget. Per chi opera in produzione la raccomandazione pratica è testare i workload critici, rimuovere scaffolding obsoleti e sfruttare le nuove funzionalità di budget per bilanciare qualità e spesa.

