Una delle questioni spinose relative all’intelligenza artificiale riguarda l’utilizzo dei contenuti presenti sul Web per addestrare i vari modelli.

Gli editori vorrebbero che le aziende che sviluppano i sistemi di IA generativa pagassero per addestrarli utilizzando i loro contenuti e ora è Reddit a pretendere che aziende come Anthropic, Perplexity e Microsoft paghino per utilizzare i suoi dati, come fanno Google e OpenAI grazie a un accordo.

Reddit ha nominato Microsoft, Anthropic e Perplexity tra le aziende che si sono rifiutate di negoziare, affermando che bloccare i crawler di queste aziende è una grossa seccatura.

Reddit accusa Microsoft, Anthropic e Perplexity di utilizzare i suoi dati senza consenso

Il CEO di Reddit Steve Huffman ha affermato che Microsoft ha utilizzato i dati di Reddit per addestrare la sua IA e riassumere il suo contenuto nei risultati di Bing senza il consenso e che i dati di Reddit sono stati venduti anche tramite l’API di Bing ad altri motori di ricerca.

Il responsabile della ricerca di Microsoft ha dichiarato che “Reddit ha impedito a Bing di scansionare il proprio sito per la ricerca, favorendo un altro motore di ricerca e influenzando la concorrenza di Bing e dei motori basati su Bing”, mentre la portavoce di Microsoft Caitlin Roulston ha dichiarato separatamente che l’azienda “rispetterà le indicazioni fornite dai siti Web che non vogliono che i contenuti delle loro pagine vengano utilizzati con i suoi modelli di intelligenza artificiale generativa”.

Jennifer Martinez di Anthropic ha dichiarato che “Reddit è nella lista di blocco per il web crawling da metà maggio”, mentre Perplexity non si è ancora pronunciata.