Dataconomy IT
  • News
  • Industry
Subscribe
No Result
View All Result
Dataconomy IT
  • News
  • Industry
Subscribe
No Result
View All Result
Dataconomy IT
No Result
View All Result

La memorizzazione nella cache implicita mira a tagliare i costi dell’API Gemini del 75%

byKerem Gülen
9 Maggio 2025
in Artificial Intelligence, News
Home Artificial Intelligence
Share on FacebookShare on Twitter

Google ha lanciato Una nuova funzionalità nell’API Gemini chiamata “Caching implicita”, che la società sostiene può ridurre i costi del 75% per gli sviluppatori di terze parti utilizzando i suoi ultimi modelli AI, Gemini 2.5 Pro e 2.5 Flash.

La funzione consente automaticamente il risparmio sui costi quando una richiesta API GEMINI a un modello colpisce una cache, eliminando la necessità di configurazione manuale richiesta dal precedente metodo di memorizzazione nella cache esplicita. Secondo Google, la memorizzazione nella cache implicita viene attivata quando una richiesta condivide un prefisso comune con una richiesta precedente e il conteggio minimo dei token prompt richiesto è 1.024 per 2,5 flash e 2.048 per 2,5 Pro.

Logan Kilpatrick, un membro della squadra Gemelli, annunciato Il lancio dell’8 maggio 2025, affermando che la funzione può offrire significativi risparmi sui costi per gli sviluppatori. Google raccomanda che gli sviluppatori mettano un contesto ripetitivo all’inizio delle richieste e aggiungono un cambiamento di contesto alla fine per aumentare le possibilità di colpi impliciti della cache.

La memorizzazione nella cache è una pratica ampiamente adottata nel settore dell’intelligenza artificiale che riutilizzi i dati frequentemente accessibili o pre-computati per ridurre i requisiti e i costi di calcolo. Il precedente metodo di memorizzazione esplicito di Google ha richiesto agli sviluppatori di definire manualmente i prompt ad alta frequenza, il che spesso ha portato a lavori extra e talvolta sorprendentemente grandi fatture API per alcuni utenti.

Alcuni sviluppatori avevano espresso insoddisfazione per l’implementazione della memorizzazione nella cache per Gemini 2.5 Pro, spingendo il team Gemini a scusarsi e impegnarsi a apportare modifiche. La nuova funzionalità di memorizzazione nella cache implicita affronta queste preoccupazioni automatizzando il processo di memorizzazione nella cache e trasmettendo risparmi sui costi per gli sviluppatori quando si verifica un colpo di cache.

Mentre Google afferma che la memorizzazione nella cache implicita può offrire un risparmio sui costi del 75%, la società non ha fornito una verifica di terze parti dell’efficacia della funzionalità. Pertanto, i risparmi sui costi effettivi possono variare a seconda di come gli sviluppatori utilizzano la funzione.


Credito d’immagine in primo piano

Tags: APIGemelliGoogle

Related Posts

Netflix lancia la votazione interattiva in tempo reale per la première live di Star Search

Netflix lancia la votazione interattiva in tempo reale per la première live di Star Search

21 Gennaio 2026
Netflix prevede di riprogettare l'app mobile nel 2026 per favorire il coinvolgimento quotidiano degli utenti

Netflix prevede di riprogettare l'app mobile nel 2026 per favorire il coinvolgimento quotidiano degli utenti

21 Gennaio 2026
OpenAI impone filtri di sicurezza sugli adolescenti tramite la previsione comportamentale dell'età

OpenAI impone filtri di sicurezza sugli adolescenti tramite la previsione comportamentale dell'età

21 Gennaio 2026
Setapp Mobile cesserà le operazioni nell'UE entro il 16 febbraio

Setapp Mobile cesserà le operazioni nell'UE entro il 16 febbraio

21 Gennaio 2026
Google lancia gli esami pratici SAT gratuiti in Gemini con Princeton Review

Google lancia gli esami pratici SAT gratuiti in Gemini con Princeton Review

21 Gennaio 2026
Samsung perde quindi elimina la revisione di Bixby con la ricerca Perplexity

Samsung perde quindi elimina la revisione di Bixby con la ricerca Perplexity

21 Gennaio 2026

Recent Posts

  • JWST identifica SN Eos: la supernova più distante mai confermata spettroscopicamente
  • Netflix lancia la votazione interattiva in tempo reale per la première live di Star Search
  • Snap paga milioni per risolvere la causa sulla dipendenza da adolescenti
  • Il CEO di Anthropic critica gli Stati Uniti e Nvidia per le vendite di chip AI in Cina
  • Netflix prevede di riprogettare l'app mobile nel 2026 per favorire il coinvolgimento quotidiano degli utenti

Recent Comments

Nessun commento da mostrare.
Dataconomy IT

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • News
  • Industry
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.