La memorizzazione nella cache implicita mira a tagliare i costi dell'API Gemini del 75%

Google ha lanciato Una nuova funzionalità nell’API Gemini chiamata “Caching implicita”, che la società sostiene può ridurre i costi del 75% per gli sviluppatori di terze parti utilizzando i suoi ultimi modelli AI, Gemini 2.5 Pro e 2.5 Flash.

La funzione consente automaticamente il risparmio sui costi quando una richiesta API GEMINI a un modello colpisce una cache, eliminando la necessità di configurazione manuale richiesta dal precedente metodo di memorizzazione nella cache esplicita. Secondo Google, la memorizzazione nella cache implicita viene attivata quando una richiesta condivide un prefisso comune con una richiesta precedente e il conteggio minimo dei token prompt richiesto è 1.024 per 2,5 flash e 2.048 per 2,5 Pro.

Logan Kilpatrick, un membro della squadra Gemelli, annunciato Il lancio dell’8 maggio 2025, affermando che la funzione può offrire significativi risparmi sui costi per gli sviluppatori. Google raccomanda che gli sviluppatori mettano un contesto ripetitivo all’inizio delle richieste e aggiungono un cambiamento di contesto alla fine per aumentare le possibilità di colpi impliciti della cache.

La memorizzazione nella cache è una pratica ampiamente adottata nel settore dell’intelligenza artificiale che riutilizzi i dati frequentemente accessibili o pre-computati per ridurre i requisiti e i costi di calcolo. Il precedente metodo di memorizzazione esplicito di Google ha richiesto agli sviluppatori di definire manualmente i prompt ad alta frequenza, il che spesso ha portato a lavori extra e talvolta sorprendentemente grandi fatture API per alcuni utenti.

Alcuni sviluppatori avevano espresso insoddisfazione per l’implementazione della memorizzazione nella cache per Gemini 2.5 Pro, spingendo il team Gemini a scusarsi e impegnarsi a apportare modifiche. La nuova funzionalità di memorizzazione nella cache implicita affronta queste preoccupazioni automatizzando il processo di memorizzazione nella cache e trasmettendo risparmi sui costi per gli sviluppatori quando si verifica un colpo di cache.

Mentre Google afferma che la memorizzazione nella cache implicita può offrire un risparmio sui costi del 75%, la società non ha fornito una verifica di terze parti dell’efficacia della funzionalità. Pertanto, i risparmi sui costi effettivi possono variare a seconda di come gli sviluppatori utilizzano la funzione.

Credito d’immagine in primo piano

La memorizzazione nella cache implicita mira a tagliare i costi dell’API Gemini del 75%

Related Posts

Netflix lancia la votazione interattiva in tempo reale per la première live di Star Search

Netflix prevede di riprogettare l'app mobile nel 2026 per favorire il coinvolgimento quotidiano degli utenti

OpenAI impone filtri di sicurezza sugli adolescenti tramite la previsione comportamentale dell'età

Setapp Mobile cesserà le operazioni nell'UE entro il 16 febbraio

Google lancia gli esami pratici SAT gratuiti in Gemini con Princeton Review

Samsung perde quindi elimina la revisione di Bixby con la ricerca Perplexity

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.