Toscana Calcio

Informazioni sull'Italia. Seleziona gli argomenti di cui vuoi saperne di più su Toscana Calcio

Cos'è Google Gemini?

Cos'è Google Gemini?

identificazione
Cos'è Google Gemini?

Fornitori di servizi su questo argomento

Google Gemini è un'intelligenza artificiale generativa sviluppata da Google e rilasciata nel dicembre 2023. Il nome Gemini viene utilizzato sia per il chatbot (ex Bard) che per il modello linguistico sottostante. Il modello linguistico è progettato per essere multimodale da zero. Può gestire testo, immagini, video, audio e codici software ed è disponibile in tre dimensioni e livelli di prestazioni: Nano, Pro e Ultra.

(Immagine: © aga7ta – Stock.adobe.com)

Google Gemini è il nome dell'intelligenza artificiale generativa introdotta nel dicembre 2023. È stato sviluppato da Google DeepMind. Secondo Google, è il Large Language Model (LLM) più grande, potente e versatile sviluppato e implementato da Google fino ad oggi. L'annuncio iniziale utilizzava il nome Gemini per un modello linguistico AI. Nel febbraio 2024, Google ha anche ribattezzato Gemini il chatbot precedentemente noto come Bard. Gemini è ora il nome sia del chatbot di Google che del modello linguistico sottostante.

I Gemelli sono per natura una persona multimediale. L’intelligenza artificiale può gestire testo, immagini, video, audio, codici software e loro combinazioni. Gemini compete con altri LLM come i modelli linguistici GPT di OpenAI (GPT-4 e altri) e il chatbot ChatGPT costruito su questi modelli linguistici. Secondo molti criteri, si dice che Gemini superi significativamente i prodotti concorrenti.

Gemini è ora disponibile in molti paesi in tutto il mondo. Il modello linguistico e il chatbot ora possono essere utilizzati anche in Germania. Google prevede di integrare l'intelligenza artificiale generativa di Gemini in molti dei propri prodotti o ha già iniziato a farlo. Gemini mira a migliorare ed espandere le funzionalità della ricerca web, del browser Chrome, del servizio Gmail, di vari strumenti di sviluppo e di altri prodotti e servizi. Gemini è anche integrato nei servizi Google come Google Cloud o Workspace. Google Duet AI è diventato Gemini for Workspace.

Google chiama la versione del chatbot Gemini Advanced, che si basa sul modello più grande Gemini Ultra 1.0. L'utilizzo di Gemini Advanced richiede un abbonamento a Google One AI Premium. Sul Google Pixel 8 Pro, il modello linguistico Gemini Nano espande le capacità dello smartphone. Ora è disponibile l'app Gemini e Gemini Advanced per smartphone Android che può sostituire l'assistente vocale Google Assistant. Per gli smartphone Apple iOS, Gemini è integrato nell'app Google esistente.

READ  HMD e Heineken presentano il Boring Phone

A metà febbraio 2024, Google ha introdotto le versioni Gemini 1.5 e 1.5 Pro. La nuova versione del modello dovrebbe essere in grado di elaborare fino a 1 milione di token. Secondo Google, la versione 1.5 dell'IA supera notevolmente i risultati dei benchmark della versione precedente.

Le tre taglie del modello Gemini

Il modello linguistico Gemini è disponibile in tre dimensioni e livelli di prestazione. Sono progettati per requisiti diversi e richiedono capacità di calcolo diverse.

Le tre dimensioni del modello Gemini sono:

  • Gemini Nano: il modello Gemini più piccolo nelle dimensioni Nano-1 e Nano-2. Destinato, ad esempio, all'implementazione locale sugli smartphone.
  • Gemini Pro: un modello di medie dimensioni e una versione base del modello AI multimediale Gemini.
  • Gemini Ultra: il modello Gemini più potente e più grande per attività multimediali complesse. Viene utilizzato, tra l'altro, per la versione Gemini Advanced del chatbot.

Competenze di base per i Gemelli

I modelli Gemini sono progettati per essere multimediali da zero. Trattano diversi tipi di informazioni. Gemini può analizzare, comprendere, combinare e creare testi, codici software, immagini, video, informazioni audio e loro combinazioni. L’intelligenza artificiale ha capacità di ragionamento multimodale avanzate ed è in grado di gestire varie forme di input, tra cui grafica, testo scritto a mano o gesti dal vivo. Le capacità logiche dei Gemelli rendono l'intelligenza artificiale adatta all'uso in discipline come matematica, fisica e altre. Nella programmazione sono supportati i linguaggi di programmazione più diffusi come Python, Java, C++ o Go. Gemini analizza o annota il codice del programma e crea righe di codice o interi programmi come indicato.

Architettura di Google Gemini

Il modello linguistico Gemini si basa sui modelli linguistici LaMDA e PaLM 2, anch'essi sviluppati da Google. Come avviene attualmente con i grandi modelli linguistici generativi, si basa sull’architettura del trasformatore. Google ha migliorato l'architettura del modello per espandere le sue capacità di formazione e dotarlo di un meccanismo di attenzione multi-query. La lunghezza del contesto supportato è 32.000 e nella versione 1.5 fino a 1 milione di caratteri. Nel modello vengono utilizzati core business come Flamingo, CoCa e PaLI. La multimodalità di Gemini non si basa sulla successiva fusione di modelli e componenti di modelli provenienti da modalità diverse, come nel caso di altri modelli multimodali. Gemini viene addestrato con dati provenienti da diverse modalità. Come piattaforma di formazione, Google ha utilizzato cluster di computer e Tensor Processing Unit (TPU) di ultima generazione v4 e v5 come acceleratori di intelligenza artificiale.

READ  Asteroidi vicini alla Terra oggi: 4 incrociatori in orbita attorno alla Terra in avvicinamento!

Risultati del benchmark per i modelli Gemini

Il più grande modello linguistico Gemini, Ultra, ha ottenuto i migliori punteggi in diversi benchmark AI e, ad esempio, ha sovraperformato il modello concorrente di OpenAI GPT-4 in diversi test. Secondo Google, Gemini supera significativamente altri modelli in aree quali la multimodalità, il pensiero multilivello, la comprensione della lettura, il ragionamento matematico, la comprensione delle immagini, la programmazione e l’elaborazione di file audio e video. Inoltre, Gemini è il primo modello linguistico a superare del 90% gli esperti umani nel benchmark Multi-Task Linguistic Understanding (MMLU). Anche nel MMMU (Multidisciplinary Comprehensive Understanding and Reasoning Standard), i Gemelli hanno ottenuto il punteggio più alto, pari al 59,4%.

(ID:49916568)