sabato, Novembre 23, 2024

Ultimi articoli

Articoli correlati

Google lancia il gioco Gemini: sfida GPT-4

Google ha ora presentato Gemini, il nuovo modello dell’azienda per l’intelligenza artificiale generativa, disponibile in tre diverse dimensioni per adattarsi a qualsiasi cosa, dai data center ai dispositivi mobili.

Google ha sviluppato il Large Language Model (LLM) di Gemini negli ultimi otto mesi e ha recentemente concesso a un piccolo gruppo di aziende l’accesso a una prima versione.

Lo strumento di intelligenza artificiale generativa basato sulla conversazione è il più potente di Google fino ad ora, secondo la società, e potrebbe diventare un serio concorrente di altri campi LLM come Llama 2 di Meta e GPT-4 di OpenAI.

“Questa nuova era della modellizzazione rappresenta uno dei nostri più grandi sforzi scientifici e tecnologici come azienda”, ha scritto il CEO di Google Sundar Pichai. In un post sul blog.

Il nuovo modello LLM può gestire diversi metodi di input, come immagini, audio e video, chiamato modello multimediale. L’approccio standard alla creazione di modelli multimodali prevede solitamente l’addestramento di componenti separati per diverse modalità e il loro successivo collegamento a cascata.

“Questi modelli a volte possono essere efficaci in determinati compiti, come la descrizione di immagini, ma hanno difficoltà con il pensiero concettuale e complesso”, afferma Pichai.

“Abbiamo progettato Gemini perché fosse intermodale, pre-addestrato fin dall’inizio in diverse modalità. Lo abbiamo poi perfezionato con ulteriori dati intermodali per migliorarne ulteriormente l’efficacia.

Gemini 1.0 sarà disponibile in tre diverse dimensioni:

  • Gemini Ultra – Il modello più grande e capace per compiti molto complessi.
  • Gemini Pro: il modello “più adatto” per adattarsi a un’ampia gamma di attività.
  • Gemini Nano: una versione creata per attività su dispositivi come i telefoni cellulari.
READ  Severe critiche alla Svezia per non aver consegnato la richiesta di vaccino

Gemini è immediatamente disponibile su alcuni prodotti Google principali. Ad esempio, il chatbot Bard utilizza una versione di Gemini Pro per pensare, pianificare e comprendere in modo più avanzato.

Pixel 8 Pro è il primo smartphone sviluppato per Gemini Nano e lo utilizza per funzionalità come Riepiloga in Recorder e Smart Response in Gboard.

“Abbiamo già iniziato a sperimentare Gemini nella ricerca, poiché rende la nostra esperienza di generazione della ricerca (SGE) più veloce”, afferma Google. “All’inizio del prossimo anno, porteremo Gemini Ultra alla nuova esperienza Bard Advanced. Nei prossimi mesi, Gemini migliorerà le funzionalità di molti dei nostri prodotti e servizi come Ads, Chrome e Duet AI.

Gli sviluppatori Android che desiderano creare app basate su Gemini per un dispositivo mobile possono ora registrarsi per un’anteprima anticipata di Gemini Nano tramite Android AI Core.

A partire dal 13 dicembre, sviluppatori e clienti aziendali possono accedere a Gemini Pro tramite l’API Gemini in Vertex AI o Google AI Studio, gli strumenti di sviluppo gratuiti basati sul web dell’azienda. Dopo aver apportato ulteriori miglioramenti a Gemini Ultra, come controlli completi di affidabilità e sicurezza, Google afferma che sarà disponibile solo per gruppi selezionati prima di essere reso disponibile a sviluppatori e clienti aziendali all’inizio del 2024.