Rete di distribuzione dei contenuti di Cloudflare sperimentato un’interruzione significativa martedì 19 novembre 2025, a causa di una query configurata in modo errato nel suo sistema di gestione dei bot, che ha avuto un impatto su vari servizi Internet a livello globale. Il co-fondatore e CEO di Cloudflare Matthew Prince ha dettagliato la causa in a articolo del blogidentificando un problema all’interno del sistema di gestione dei bot, che gestisce i crawler automatizzati. Questo problema specifico ha provocato la “peggiore interruzione di Cloudflare dal 2019”. Circa 20 per cento del traffico web attraverso la rete di Cloudflare, come riportato dalla società lo scorso anno. L’interruzione ha disconnesso numerosi servizi, tra cui X, ChatGPT e Downdetector, per diverse ore. Questo incidente assomiglia a precedenti interruzioni che hanno coinvolto Microsoft Azure e Servizi Web di Amazon. I controlli dei bot di Cloudflare affrontano sfide come i crawler che recuperano i dati per la formazione sull’intelligenza artificiale generativa. La società ha recentemente introdotto “AI Labyrinth”, un metodo di mitigazione che utilizza contenuti generati dall’intelligenza artificiale per impedire crawler e bot AI non conformi. Tuttavia, l’interruzione è derivata da modifiche al sistema di autorizzazioni di un database, non dalla tecnologia di intelligenza artificiale generativa, DNS o da attività dannose come un “attacco DDoS su vasta scala”, inizialmente considerato da Cloudflare. Prince ha spiegato che il Gestione dei bot Il modello di apprendimento automatico del sistema, che genera punteggi bot per le richieste di rete, utilizza un file di configurazione aggiornato frequentemente per identificare le richieste automatizzate. Un “modifica nel comportamento delle nostre query ClickHouse sottostanti che genera questo file ha causato la presenza di un gran numero di righe di” funzionalità “duplicate.” Questa alterazione della query ha portato il database ClickHouse a produrre informazioni duplicate. Il file di configurazione ha superato rapidamente i limiti di memoria preimpostati, causando il guasto del “sistema proxy principale che gestisce l’elaborazione del traffico per i nostri clienti, per qualsiasi traffico che dipendesse dal modulo bot”. Di conseguenza, le aziende che utilizzano le regole di Cloudflare per bloccare i bot tagliano erroneamente il traffico legittimo, mentre i clienti che non utilizzano il punteggio del bot generato nelle loro regole rimangono online. Cloudflare ha delineato quattro piani specifici per evitare incidenti simili:
- Ingestione indurente: Rafforzamento dell’acquisizione dei file di configurazione generati da Cloudflare secondo lo stesso standard dell’input generato dall’utente.
- Abilitare più kill switch globali: Implementazione di ulteriori opzioni di disabilitazione generale per le funzionalità.
- Eliminazione dei core dump: Prevenzione di core dump o altre segnalazioni di errori da parte delle risorse di sistema eccessive.
- Revisione delle modalità di errore: Esame delle modalità di guasto delle condizioni di errore su tutti i moduli proxy principali.





