Dataconomy IT
  • News
  • Industry
Social icon element need JNews Essential plugin to be activated.
Subscribe
No Result
View All Result
Dataconomy IT
  • News
  • Industry
Social icon element need JNews Essential plugin to be activated.
Subscribe
No Result
View All Result
Dataconomy IT
No Result
View All Result

La memorizzazione nella cache implicita mira a tagliare i costi dell’API Gemini del 75%

byKerem Gülen
9 Maggio 2025
in Artificial Intelligence, News
Home Artificial Intelligence

Google ha lanciato Una nuova funzionalità nell’API Gemini chiamata “Caching implicita”, che la società sostiene può ridurre i costi del 75% per gli sviluppatori di terze parti utilizzando i suoi ultimi modelli AI, Gemini 2.5 Pro e 2.5 Flash.

La funzione consente automaticamente il risparmio sui costi quando una richiesta API GEMINI a un modello colpisce una cache, eliminando la necessità di configurazione manuale richiesta dal precedente metodo di memorizzazione nella cache esplicita. Secondo Google, la memorizzazione nella cache implicita viene attivata quando una richiesta condivide un prefisso comune con una richiesta precedente e il conteggio minimo dei token prompt richiesto è 1.024 per 2,5 flash e 2.048 per 2,5 Pro.

Logan Kilpatrick, un membro della squadra Gemelli, annunciato Il lancio dell’8 maggio 2025, affermando che la funzione può offrire significativi risparmi sui costi per gli sviluppatori. Google raccomanda che gli sviluppatori mettano un contesto ripetitivo all’inizio delle richieste e aggiungono un cambiamento di contesto alla fine per aumentare le possibilità di colpi impliciti della cache.

La memorizzazione nella cache è una pratica ampiamente adottata nel settore dell’intelligenza artificiale che riutilizzi i dati frequentemente accessibili o pre-computati per ridurre i requisiti e i costi di calcolo. Il precedente metodo di memorizzazione esplicito di Google ha richiesto agli sviluppatori di definire manualmente i prompt ad alta frequenza, il che spesso ha portato a lavori extra e talvolta sorprendentemente grandi fatture API per alcuni utenti.

Alcuni sviluppatori avevano espresso insoddisfazione per l’implementazione della memorizzazione nella cache per Gemini 2.5 Pro, spingendo il team Gemini a scusarsi e impegnarsi a apportare modifiche. La nuova funzionalità di memorizzazione nella cache implicita affronta queste preoccupazioni automatizzando il processo di memorizzazione nella cache e trasmettendo risparmi sui costi per gli sviluppatori quando si verifica un colpo di cache.

Mentre Google afferma che la memorizzazione nella cache implicita può offrire un risparmio sui costi del 75%, la società non ha fornito una verifica di terze parti dell’efficacia della funzionalità. Pertanto, i risparmi sui costi effettivi possono variare a seconda di come gli sviluppatori utilizzano la funzione.


Credito d’immagine in primo piano

Tags: APIGemelliGoogle

Recent Posts

  • ML Tracciamento delle prestazioni
  • Apple sviluppa nuovi chip per vetri intelligenti e Mac.
  • SkyMizer lancia Iper Thought AI per dispositivi Smart Edge
  • Sigenergy flette la suite di energia completa di AI all’Europa intersolare
  • Top 5 assistenti di ricerca AI che competono con Chatgpt

Recent Comments

Nessun commento da mostrare.
Dataconomy IT

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Follow Us

Social icon element need JNews Essential plugin to be activated.
  • News
  • Industry
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.