Microsoft ha annunciato il lancio di tre modelli di intelligenza artificiale sviluppati internamente: MAI-Transcribe-1, MAI-Voice-1 e MAI-Image-2. I tre modelli coprono tre delle aree più strategicamente rilevanti nell’AI aziendale, come la conversione del parlato in testo, la generazione di voce realistica e la creazione di immagini. Questi nuovi strumenti sono già integrati nei prodotti Microsoft come Copilot, Bing, PowerPoint e Azure Speech, ma da oggi sono disponibili anche agli sviluppatori esterni tramite Microsoft Foundry.
I numeri e le prestazioni dietro i nuovi modelli sono significativi. MAI-Transcribe-1 supporta 25 lingue con una velocità di trascrizione 2,5 volte superiore all’offerta Azure Fast, e a un costo GPU circa del 50% inferiore rispetto alle alternative leader sul mercato. MAI-Voice-1 genera 60 secondi di audio in un solo secondo, con la possibilità di creare voci personalizzate da pochi secondi di campione audio. MAI-Image-2 è invece entrato direttamente nella top 3 della classifica Arena.ai per i modelli di generazione di immagini. Sui prezzi, Mustafa Suleyman, CEO di Microsoft AI, ha dichiarato a VentureBeat: “Saranno i più economici tra tutti gli hyperscaler. È una scelta consapevole”.
Il lancio arriva in un momento delicato per il colosso di Redmond. Il titolo Microsoft ha perso circa il 17% dall’inizio dell’anno, e gli investitori chiedono con crescente urgenza prove che i miliardi investiti in AI stiano generando ritorni concreti. La mossa fa parte di uno sforzo più ampio per espandere le capacità AI proprietarie di Microsoft al di là della partnership con OpenAI, dando all’azienda maggiore controllo sul proprio futuro competitivo, senza però rompere con essa.

Microsoft, accordo con Chevron e Engine No. 1 per costruire una centrale elettrica per l'AI
L'obiettivo è alimentare un enorme campus di data center dedicato…














