Reddit ha archiviato una causa contro la società di motori di risposta Perplexity e tre fornitori di servizi di data scraping, SerpApi, Oxylabs e AWMProxy. L’azione legale cerca di fermare quella che la denuncia di Reddit descrive come l’elusione illegale e su scala industriale della sua protezione dei dati. La denuncia afferma che Perplexity è cliente di almeno una di queste aziende di data-scraping. Reddit utilizza una metafora per descrivere la presunta attività, paragonando i fornitori a “aspiranti rapinatori di banche” che, non potendo accedere direttamente al “archivio dati” dell’azienda, prendono invece di mira il “camion blindato” che trasporta le informazioni. Ciò implica che gli imputati accedono ai contenuti di Reddit attraverso canali indiretti. La causa afferma che Perplexity sta scegliendo di acquisire dati attraverso questi mezzi piuttosto che perseguire un accordo di licenza diretta, un percorso intrapreso da alcuni dei suoi concorrenti. Secondo la documentazione del tribunale, Reddit ha inviato una lettera di cessazione e desistenza a Perplexity nel maggio 2024, chiedendogli di smettere di rimuovere dati dalla piattaforma. In seguito alla consegna di questa lettera, il volume delle citazioni di Reddit apparse sul servizio di Perplexity sarebbe aumentato. Per indagare ulteriormente, Reddit ha creato un post sulla sua piattaforma configurata per essere scansionabile solo da Google. L’azienda afferma che “nel giro di poche ore”, il motore di risposta di Perplexity “ha prodotto il contenuto” di questo post specifico. Reddit sostiene che l’unico modo in cui Perplexity avrebbe potuto acquisire questo contenuto era se lui, o i suoi co-imputati, avessero estratto i risultati di ricerca di Google per i contenuti Reddit e li avessero rapidamente integrati nel suo sistema.
Samsung lancia l’app Perplexity TV con Vision AI
Il contenuto generato dagli utenti della piattaforma, che consiste in post scritti e classificati da esseri umani su una vasta gamma di argomenti, è diventato una risorsa preziosa per l’addestramento di modelli di intelligenza artificiale. Nel 2023, Reddit ha implementato modifiche all’API che hanno portato alle proteste degli utenti; l’azienda ha posizionato questi cambiamenti come un modo per assicurarsi di essere compensata per l’utilizzo dei propri dati da parte degli sviluppatori di intelligenza artificiale. Da allora, Reddit ha stretto accordi di licenza sui dati con aziende tra cui OpenAI e Google e, secondo quanto riferito, sta cercando ulteriori accordi. Questa non è la prima sfida legale di Reddit in quest’area; in precedenza aveva citato in giudizio Anthropic, sostenendo che i suoi bot continuavano ad accedere al sito dopo che la società aveva dichiarato il contrario. Ben Lee, responsabile legale di Reddit, ha descritto la situazione come “un’economia di “riciclaggio di dati” su scala industriale alimentata da una “corsa agli armamenti di intelligenza artificiale per contenuti umani di qualità”. Ha dichiarato: “Gli scraper aggirano le protezioni tecnologiche per rubare dati, quindi venderli a clienti affamati di materiale formativo. Reddit è un obiettivo primario perché è una delle raccolte più grandi e dinamiche di conversazioni umane mai create.” Lee ha identificato i co-imputati Oxylabs UAB, AWM Proxy e SerpAI come “esempi da manuale di questo comportamento illegale”, descrivendoli come un oscuro scraper lituano, un’ex botnet russa e una società che pubblicizza tattiche discutibili. Ha aggiunto: “Incapaci di raschiare Reddit direttamente, mascherano le loro identità, nascondono le loro posizioni e mascherano i loro web scraper per rubare i contenuti Reddit dalla Ricerca Google.” In risposta alla causa, il capo della comunicazione di Perplexity, Jesse Dwyer, ha dichiarato che la società non aveva ancora ricevuto la documentazione legale. Dwyer ha detto Il limite“lotteremo sempre vigorosamente per il diritto degli utenti ad accedere liberamente ed equamente alla conoscenza pubblica.” Ha aggiunto: “Il nostro approccio rimane basato su principi e responsabilità poiché forniamo risposte concrete con un’intelligenza artificiale accurata e non tollereremo minacce contro l’apertura e l’interesse pubblico”.





