Microsoft ha presentato Magma, l’AI ‘per robot’ che unisce visione, linguaggio e azione

Microsoft ha svelato un innovativo modello multimodale progettato per rivoluzionare l'interazione tra l'AI e il mondo fisico.

2 min.

Microsoft ha presentato Magma, l’AI ‘per robot’ che unisce visione, linguaggio e azione

Microsoft ha svelato Magma, un innovativo modello di intelligenza artificiale multimodale progettato per rivoluzionare l’interazione tra l’AI e il mondo fisico. È strutturato in particolare per l’applicazione al mondo della robotica. A differenza dei tradizionali modelli di linguaggio, Magma è in grado di elaborare simultaneamente dati testuali, immagini e video, consentendo una comprensione integrata e una risposta efficace a compiti complessi sia nel dominio digitale che in quello reale.

“Formulare piani ed eseguire azioni”

La caratteristica distintiva di Magma risiede nella sua capacità di “formulare piani ed eseguire azioni” per raggiungere obiettivi specifici. Questo significa che, oltre a interpretare informazioni multimodali, Magma può agire autonomamente, controllando interfacce software e sistemi robotici con precisione. Ad esempio, può navigare attraverso un’interfaccia utente o manipolare oggetti fisici, come posizionare un ingrediente in una ciotola o spostare un panno su una superficie.

Architettura tecnica avanzata

Sviluppato in collaborazione con istituzioni accademiche di prestigio, tra cui KAIST, University of Maryland, University of Wisconsin-Madison e University of Washington, Magma integra architetture di deep learning e un pre-addestramento su larga scala. Utilizza un backbone visivo ConvNeXt-XXL per l’elaborazione di immagini e video, mentre un modello linguistico LLaMA-3-8B gestisce gli input testuali. La combinazione permette a Magma di comprendere e integrare informazioni visive e linguistiche in modo fluido, facilitando l’esecuzione di compiti che richiedono una comprensione spaziale e temporale.

Le potenziali applicazioni di Magma sono vaste e variegate. Nel settore della robotica, potrebbe consentire a robot di ogni tipologia di eseguire compiti quotidiani con maggiore autonomia e precisione.


Ultime news


Trump, un video fatto con AI per rispondere nel suo stile alle proteste “No Kings”

Nel video il presidente, alla guida di un caccia militare…

Suno verso una valutazione di 2 miliardi di dollari

Una nuova raccolta fondi per la società potrebbe superare i…

Fame di energia per l’AI: in USA cresce un metodo per estrarre idrocarburi vietato in Europa

In Texas diversi progetti infrastrutturali di intelligenza artificiale prevedono l'estrazione…

Le persone consultano sempre meno Wikipedia a causa delle nuove ricerche AI

Lo afferma la Wikimedia Foundation: il traffico sul sito è calato…

In California una donna si è difesa in tribunale usando solo l’AI e ha vinto la causa

ChatGPT e Perplexity hanno assistito una donna in una causa…

In Evidenza


Arriva l’Italian Prompt Battle: il primo torneo italiano di prompting si terrà a Milano

Gli ideatori, Lucia Cenetiempo e Massimiliano Di Blasi, ci raccontano…

Scale AI conferma l’investimento di Meta e l’uscita del CEO Alexandr Wang

La società Scale AI ha confermato l'investimento di Meta e…

I modelli generativi inquinano l’informazione? La nostra intervista a Luciano Floridi | AI Talks #13

La nostra intervista a Luciano Floridi, già professore di filosofia…

L’AI ha fatto divorziare la capacità di agire e l’intelligenza: la nuova umanità secondo Floridi

Luciano Floridi, a teatro, ha esplorato la natura umana, contrapposta,…

Privacy policy| Cookie policy| Cookie setting| © 2025

Exit mobile version