Sono in arrivo nuove funzionalità di Gemini, già presentate in anteprima a maggio al Google I/O. I Gem sono una nuova funzione che consente di personalizzare il modello di linguaggio di Google per creare esperti AI specializzati e sono ora disponibili per gli utenti di Gemini Advanced, Gemini Business e Gemini Enterprise. Inoltre, il nuovo modello di generazione di immagini, Imagen 3, è ora disponibile su Gemini, Gemini Advanced, Business ed Enterprise.
I temi trattati all’interno dell’articolo
La personalizzazione dei Gem
Nei prossimi giorni, gli abbonati potranno iniziare a creare e chattare con i Gem. È possibile personalizzarli in modo che fungano da esperti su specifici argomenti o perfezionarli in base ai propri obiettivi specifici. È sufficiente scrivere le istruzioni per il proprio Gem, dargli un nome e cominciare a chattare. Il Gem personalizzato può anche ricordare una serie di istruzioni dettagliate per aiutarci a risparmiare tempo su compiti noiosi, ripetitivi o difficili.
I Gem disponibili
Google ha creato una serie di Gem predefiniti per diversi scenari, tra cui:
- Coach per l’apprendimento
- Generatore di idee
- Consulente di carriera
- Editor di scrittura
- Partner di programmazione
I Gem saranno rilasciati su desktop e dispositivi mobile per gli utenti di Gemini Advanced, Gemini Business e Gemini Enterprise in oltre 150 Paesi e nella maggior parte delle lingue.
Il nuovo text-to-image, Imagen 3
La società di Mountain View ha aggiornato le capacità di generazione di immagini dei suoi strumenti e nei prossimi giorni porterà il suo ultimo modello di generazione di immagini, Imagen 3, su Gemini – desktop e mobile – e ne amplierà la disponibilità per gli utenti in tutte le lingue.
Imagen 3 stabilisce un nuovo standard per la qualità delle immagini, che genera anche a partire da prompt di poche parole. È anche possibile chiedere a Gemini di creare immagini in vari stili, come paesaggi fotorealistici, dipinti ad olio o scene di claymation.
Il tool offre funzionalità avanzate di generazione di immagini con funzionalità di protezione integrate e aderisce ai principi dell’azienda in termini di progettazione del prodotto. In un’ampia gamma di benchmark, Imagen 3 si distingue per le sue prestazioni rispetto agli altri modelli di generazione di immagini disponibili. Come per Imagen 2, Google utilizza SynthID, il suo strumento per il watermarking delle immagini generate dall’intelligenza artificiale.
Inoltre, se l’immagine inizialmente generata non soddisfa le aspettative dell’utente, questi può indicare a Gemini cosa vuole cambiare e il modello fornirà una nuova immagine.
Nei prossimi giorni, la società inizierà anche a rilasciare la funzionalità di generazione di immagini di persone, con early access per gli utenti Gemini Advanced, Business ed Enterprise, a partire dalla lingua inglese.
“Con Imagen 3 abbiamo fatto notevoli passi avanti per offrire all’utente un’esperienza migliore nella generazione di immagini di persone – dichiarano dall’azienda – Non supportiamo la generazione di immagini di individui fotorealistici e identificabili né la rappresentazione di minori o di scene eccessivamente cruente, violente o a sfondo sessuale. Siamo consapevoli che non tutte le immagini create da Gemini saranno perfette, ma lavoreremo per migliorare in base ai feedback forniti dagli utenti di Gemini Advanced con accesso in anteprima. Il sistema verrà introdotto gradualmente, con l’obiettivo di renderlo presto disponibile a un numero maggiore di utenti e di lingue”.