Editoria & Media
Etica
Finanza
Governance
Istruzione
Legal
Difesa
Sanità
Altri temi

Microsoft ha presentato Magma, l’AI ‘per robot’ che unisce visione, linguaggio e azione

Microsoft ha svelato un innovativo modello multimodale progettato per rivoluzionare l'interazione tra l'AI e il mondo fisico.

Innovazione - Robotica Edoardo Frasso 24 feb 2025

2 min.

Innovazione - Robotica

Edoardo Frasso 24 feb 2025

Seguici su Google News

2 minuti

Microsoft ha presentato Magma, l’AI ‘per robot’ che unisce visione, linguaggio e azione

Microsoft ha svelato Magma, un innovativo modello di intelligenza artificiale multimodale progettato per rivoluzionare l’interazione tra l’AI e il mondo fisico. È strutturato in particolare per l’applicazione al mondo della robotica. A differenza dei tradizionali modelli di linguaggio, Magma è in grado di elaborare simultaneamente dati testuali, immagini e video, consentendo una comprensione integrata e una risposta efficace a compiti complessi sia nel dominio digitale che in quello reale.

“Formulare piani ed eseguire azioni”

La caratteristica distintiva di Magma risiede nella sua capacità di “formulare piani ed eseguire azioni” per raggiungere obiettivi specifici. Questo significa che, oltre a interpretare informazioni multimodali, Magma può agire autonomamente, controllando interfacce software e sistemi robotici con precisione. Ad esempio, può navigare attraverso un’interfaccia utente o manipolare oggetti fisici, come posizionare un ingrediente in una ciotola o spostare un panno su una superficie.

Anche Meta punta sugli umanoidi: in arrivo un team dedicato ai robot

Architettura tecnica avanzata

Sviluppato in collaborazione con istituzioni accademiche di prestigio, tra cui KAIST, University of Maryland, University of Wisconsin-Madison e University of Washington, Magma integra architetture di deep learning e un pre-addestramento su larga scala. Utilizza un backbone visivo ConvNeXt-XXL per l’elaborazione di immagini e video, mentre un modello linguistico LLaMA-3-8B gestisce gli input testuali. La combinazione permette a Magma di comprendere e integrare informazioni visive e linguistiche in modo fluido, facilitando l’esecuzione di compiti che richiedono una comprensione spaziale e temporale.

Le potenziali applicazioni di Magma sono vaste e variegate. Nel settore della robotica, potrebbe consentire a robot di ogni tipologia di eseguire compiti quotidiani con maggiore autonomia e precisione.

Articoli simili

Suno verso una valutazione di 2 miliardi di dollari

Una nuova raccolta fondi per la società potrebbe superare i 100 milioni di dollari

continua...

Con AI Translations Meta punta ad abbattere il muro della lingua nei suoi reels

Meta vuole superare le barriere linguistiche e culturali creando un ecosistema mondiale online che permette a tutti di comunicare con tutti

continua...

Google ha lanciato un aggiornamento del suo strumento di generazione video AI Veo

L'aggiornamento apporta miglioramenti su realismo, controllo e continuità nelle scene per stare al passo con la competizione di Sora

continua...

Anthropic ha lanciato una nuova versione del modello Haiku

Secondo l'azienda Haiku 4.5 offre prestazioni simili a Sonnet 4 ma con costi ridotti e una velocità maggiore

continua...

Datapizza lancia un framework open-source tutto italiano per costruire agenti AI

Datapizza intende contribuire al panorama tecnologico nazionale, dimostrando che anche in Italia è possibile sviluppare strumenti AI innovativi.

continua...

Ultime news

Trump, un video fatto con AI per rispondere nel suo stile alle proteste “No Kings”

Nel video il presidente, alla guida di un caccia militare…

Suno verso una valutazione di 2 miliardi di dollari

Una nuova raccolta fondi per la società potrebbe superare i…

Fame di energia per l’AI: in USA cresce un metodo per estrarre idrocarburi vietato in Europa

In Texas diversi progetti infrastrutturali di intelligenza artificiale prevedono l'estrazione…

Le persone consultano sempre meno Wikipedia a causa delle nuove ricerche AI

Lo afferma la Wikimedia Foundation: il traffico sul sito è calato…

In California una donna si è difesa in tribunale usando solo l’AI e ha vinto la causa

ChatGPT e Perplexity hanno assistito una donna in una causa…

In Evidenza

Arriva l’Italian Prompt Battle: il primo torneo italiano di prompting si terrà a Milano

Gli ideatori, Lucia Cenetiempo e Massimiliano Di Blasi, ci raccontano…

Federico Faggin: “L’intelligenza artificiale non potrà mai essere cosciente”. La nostra intervista al padre del microchip | AI Talks #18

Faggin: "L'essere umano e la macchina sono due cose diverse.…

Scale AI conferma l’investimento di Meta e l’uscita del CEO Alexandr Wang

La società Scale AI ha confermato l'investimento di Meta e…

I modelli generativi inquinano l’informazione? La nostra intervista a Luciano Floridi | AI Talks #13

La nostra intervista a Luciano Floridi, già professore di filosofia…

L’AI ha fatto divorziare la capacità di agire e l’intelligenza: la nuova umanità secondo Floridi

Luciano Floridi, a teatro, ha esplorato la natura umana, contrapposta,…

Face recognition

Foundation model

Privacy policy| Cookie policy| Cookie setting| © 2025

Exit mobile version