Lunedì 29 settembre Anthropic ha presentato Claude Sonnet 4.5, un modello con elevate capacità di programmazione e di gestione delle attività scientifiche e finanziarie. Il modello è pensato più per le aziende che per i singoli utenti.
Secondo quanto affermato dall’azienda, il modello è “il migliore al mondo” nella programmazione e per l’uso di computer, il “più potente” per la creazione di agenti complessi e mostra inoltre “sostanziali” progressi nel campo del ragionamento e della matematica. Claude 4.5 ha ottenuto prestazioni di punta in benchmark di codifica real-world come SWE-Bench Verified, e in un altro benchmark che testa la destrezza del sistema operativo riscontrato un punteggio di circa il 60% contro il 40% ottenuto dai modelli precedenti.
Attraverso dei test interni, Sonnet 4.5 è stato in grado di creare un’app da zero e un cliente è riuscito a utilizzare il codice del chatbot AI in modo autonomo per 30 ore consecutive. Attualmente Claude 4.5 è disponibile tramite Claude API o chatbot, ed è integrato anche in GitHub Copilot per vari piani (Pro, Enterprise, Business). Il prezzo per gli sviluppatori rimane lo stesso di Claude Sonnet 4, ovvero 3 USD per milione di token in input, 15 USD per milione di token in output.
🤖
- Anthropic ha accettato di pagare 1,5 miliardi di dollari per fermare la class action degli autori nei suoi confronti
- Per la prima volta OpenAI e Anthropic hanno collaborato sulla sicurezza dell’AI
- Anthropic annuncia lo strumento di AI agentica Claude per Chrome
- Anthropic punta sull’enterprise
- Anthropic offre Claude al governo USA per un dollaro
- La funzione ‘Memoria’ arriva anche su Claude
- Anthropic lancia Claude Opus 4.1: un aggiornamento senza variazioni di prezzo
- Anthropic “spiata” da OpenAI: revocato l’accesso alla sua API
Microsoft integra l'AI di Anthropic in 365 Copilot distanziandosi sempre di più da OpenAI
L'accordo con Anthropic è solo l'ultima di un insieme di…