Tramite un comunicato ufficiale la startup di intelligenza artificiale statunitense Anthropic ha rilasciato alcuni aggiornamenti del proprio assistente AI Claude. Si tratta di Claude Opus 4 e Claude Sonnet 4 che, a detta dell’azienda produttrice, “stabiliscono nuovi standard per la codifica, il ragionamento avanzato e gli agenti di intelligenza artificiale“.
Il primato di Opus 4
Opus 4 in particolare viene definito “il miglior modello di programmazione al mondo, con prestazioni costanti su attività complesse e di lunga durata e flussi di lavoro degli agenti“. È leader nei test SWE-bench (72,5%) e Terminal-bench (43,2%) e offre prestazioni costanti su attività di lunga durata che richiedono elevato impegno e numerosi passaggi anche della durata di diverse ore. Supera ampiamente nelle prestazioni tutti i modelli Sonnet e amplia significativamente le potenzialità degli agenti di intelligenza artificiale.
Le caratteristiche di entrambi i modelli
Entrambi i modelli hanno facoltà di utilizzare strumenti in parallelo nell’ambito del loro pensiero esteso. L’azienda li definisce come “due modelli ibridi che offrono due modalità“. Da un lato “risposte quasi istantanee” e dall’altro un “pensiero esteso per un ragionamento più approfondito“. La ricerca sul web ad esempio, è un elemento che permette a Claude di alternare fra ragionamento e utilizzo di strumenti per migliorare le risposte.
Pensiero esteso
Il pensiero esteso si riferisce alla teoria secondo cui il pensiero umano non è limitato al cervello, ma si estende anche al di fuori del corpo, attraverso l’utilizzo di strumenti, tecnologie e l’ambiente circostante. Questa idea, introdotta da Andy Clark e David Chalmers nel 1998, suggerisce che la mente può essere considerata un processo che si estende anche al di fuori dei confini del cervello.
Le capacità di memoria di entrambi i modelli sono inoltre migliorate, garantendo così la possibilità di estrarre e salvare dati chiave per mantenere la continuità e costruire conoscenza tacita nel tempo.
Claude Code, disponibile a tutto il pubblico, supporta le attività in background tramite GitHub Actions e integrazioni native con VS Code e JetBrains, e presto l’azienda rilascerà quattro nuove funzionalità sull’API Anthropic che consentiranno agli sviluppatori di creare agenti di intelligenza artificiale più potenti.
“Questi modelli rappresentano un grande passo avanti verso il collaboratore virtuale, mantenendo il contesto completo, concentrandosi su progetti più a lungo termine e generando un impatto trasformativo” conclude l’azienda nel suo comunicato.
Anthropic, Claude legge Gmail e il tuo Google Calendar
Grazie al servizio, sarà possibile accedere ai propri dati in…