Esclusiva

Giugno 26 2023
Intelligenza Artificiale: i grandi marchi finanziano “content farm” di notizie inaffidabili

NewsGuard ha identificato 141 aziende che, tramite la pubblicità programmatica, stanno finanziando involontariamente siti di notizie e informazioni di bassa qualità generati dall’intelligenza artificiale, che operano con poca o nessuna supervisione umana

Di Jack Brewster, Zack Fishman e Elisa Xu

Con la collaborazione di Chiara Vercellone, Sara Badilini, Natalie Huet, Leonie Pfaller e Giulia Pozzi

Secondo un’analisi di NewsGuard, i principali marchi a livello mondiale stanno supportando attraverso la pubblicità programmatica la rapida proliferazione dei sempre più numerosi siti inaffidabili di notizie e informazioni generate dall’intelligenza artificiale (anche detti ‘siti UAIN’, dall’inglese Unreliable Artificial Intelligence-Generated News).

Sembrerebbe trattarsi di annunci pubblicitari inseriti in modo automatico, il che significa che le pubblicità non compaiono su questi siti per scelta dei marchi, ma automaticamente, attraverso un sistema di tecnologia pubblicitaria che non tiene conto della natura dei siti stessi. Questo approccio programmatico alla pubblicità finanzia fonti di bassa qualità e di misinformazione, senza alcuna protezione per la sicurezza del marchio. La maggior parte degli annunci trovati è fornita da Google.

NewsGuard definisce i siti UAIN come siti che operano con poca o nessuna supervisione umana e che pubblicano articoli scritti in gran parte o interamente da bot. Soltanto nell’ultimo mese, il numero di questi siti, identificati dagli analisti di NewsGuard e riportati nel suo nuovo Centro di monitoraggio sull’IA, è passato da 49 a 217. (Per saperne di più su come NewsGuard definisce e riconosce un sito UAIN, puoi consultare la sezione dedicata alla metodologia in fondo a questo report).

Molti di questi siti generati dall’intelligenza artificiale sembrano essere interamente finanziati dalla pubblicità programmatica. Alcuni sfornano enormi quantità di articoli sui quali è possibile inserire annunci, incentivando così la creazione di siti di bassa qualità generati dall’intelligenza artificiale, senza alcuna apparente supervisione editoriale. Ad esempio, uno dei siti UAIN identificati da NewsGuard produce in media più di 1.200 articoli al giorno.  Sebbene molti inserzionisti e le loro agenzie pubblicitarie utilizzino delle “liste di esclusione” di siti che risultano “non sicuri per il marchio” per far sì che non vi compaiano le loro pubblicità, queste liste spesso non sono aggiornate e chiaramente non hanno tenuto il passo con la diffusione dei siti UAIN.

Nei mesi di maggio e giugno 2023, gli analisti di NewsGuard hanno individuato 393 annunci programmatici appartenenti a 141 grandi marchi e apparsi su 55 dei 217 siti UAIN identificati da NewsGuard. Non tutti i siti UAIN individuati riportano annunci di grandi marchi e alcuni non pubblicano alcun annuncio programmatico. Le pubblicità sono state individuate da analisti di NewsGuard con sede in quattro Paesi: Stati Uniti, Germania, Francia e Italia.

Dal momento che è probabile che nessuno dei marchi o delle loro agenzie pubblicitarie fosse consapevole che i loro annunci sarebbero apparsi su questi siti inaffidabili e gestiti dall’intelligenza artificiale, NewsGuard ha deciso di non farne i nomi. Eppure, si tratta di una vasta gamma di inserzionisti di prim’ordine: sei grandi banche e società di servizi finanziari, quattro grandi magazzini di lusso, tre marchi leader nel settore dell’abbigliamento sportivo, tre produttori di elettrodomestici, due delle più grandi aziende di prodotti di elettronica del mondo, due società di e-commerce, due dei principali fornitori di servizi a banda larga degli Stati Uniti, tre servizi di streaming offerti dalle reti di trasmissione americane, una piattaforma digitale della Silicon Valley e una grande catena europea di supermercati.

Più del 90% degli annunci identificati da NewsGuard – 356 su 393 – sono stati inseriti da Google Ads, la più grande piattaforma pubblicitaria online, che lo scorso anno ha generato 168 miliardi di dollari di entrate solo dalla pubblicità online, secondo Digiday.

La pubblicità programmatica utilizza algoritmi e sofisticati processi d’asta per fornire annunci digitali mirati direttamente ai singoli utenti, anziché a siti specifici. Ciò significa che gli annunci “seguono” gli utenti durante la navigazione online.

Poiché questo processo è così poco trasparente, è probabile che i marchi a cui fa riferimento questo report non abbiano idea di contribuire a finanziare la diffusione dei siti UAIN, dal momento che gli annunci vengono acquistati tramite terzi e gli intermediari coinvolti sono molteplici.

Così i grandi marchi finanziano siti che usano l’IA per plagiare contenuti altrui e promuovere cure sanitarie fasulle

Tutti i 393 annunci individuati da NewsGuard sono apparsi direttamente accanto ad articoli contenenti messaggi di errore noti per essere generati da chatbot di intelligenza artificiale, un indicatore del fatto che tali siti sembrano operare con poca o nessuna supervisione editoriale umana.

Ad esempio, NewsGuard ha trovato annunci programmatici di una nota banca, di due fornitori di banda larga, di un’azienda di abbigliamento sportivo di alto profilo e di una casa automobilisticaaccanto a un articolo di NoticiasDeEmprego.com.br, un sito brasiliano di informazioni sul mondo del lavoro, che conteneva il seguente messaggio di errore prodotto dal chatbot proprio nel titolo: “Mi dispiace, in quanto modello linguistico dell’intelligenza artificiale, non sono in grado di accedere autonomamente a link esterni o siti”.

Intelligenza Artificiale: i grandi marchi finanziano "content farm" di notizie inaffidabili
Una pubblicità di un marchio di abbigliamento sportivo su NoticiasDeEmprego.com.br, un sito UAIN che pubblica notizie generate dall’intelligenza artificiale sulle opportunità di lavoro in Brasile. NewsGuard ha oscurato l’inserzione pubblicitaria. (Screenshot di NewsGuard)

Alcuni dei siti UAIN su cui sono apparsi gli annunci di grandi marchi sembrano aver utilizzato strumenti di intelligenza artificiale per riscrivere articoli di testate giornalistiche tradizionali, spesso senza che venisse citata la fonte. Ad esempio, gli annunci di un sito di affitti di appartamenti negli Stati Uniti, di un sito di e-commerce, di una stampante per ufficio giapponese e di un produttore di elettronica cinese sono apparsi accanto a un articolo pubblicato dal sito UAIN AlaskaCommons.com che sembrava essere una versione riscritta dall’intelligenza artificiale della stessa storia pubblicata dall’edizione statunitense del tabloid britannico The Sun. L’articolo conteneva le stesse immagini e frasi simili. Verso la fine dell’articolo di AlaskaCommons.com, si legge “Come ottenere scommesse gratuite sul calcio”, lo stesso sottotitolo apparso sul Sun, e poi un paragrafo che ripeteva un messaggio di errore generato dall’IA: “Come modello linguistico di intelligenza artificiale, non posso fornire informazioni sulle scommesse gratuite sul calcio. Per maggiori informazioni, si prega di fare riferimento a fonti di notizie affidabili o a siti di scommesse”. The Sun non ha risposto a due email del giugno 2023 in cui NewsGuard chiedeva se AlaskaCommons.com avesse il permesso di copiare i contenuti dal suo sito web.

Anche in questo caso, i marchi i cui annunci appaiono accanto a questi contenuti di bassa qualità o apparentemente plagiati non hanno spesso modo di verificare che stanno finanziando questi siti.

Per essere chiari, la maggior parte degli annunci individuati da NewsGuard è apparsa su siti generati dall’intelligenza artificiale di bassa qualità, ma che non diffondono misinformazione. Tuttavia, NewsGuard ha trovato annunci di due servizi di streaming video statunitensi, un’azienda di forniture per ufficio, una casa automobilistica giapponese, una banca con sede a New York, un negozio di animali domestici, un negozio di vitamine, un’azienda di prodotti dietetici e un produttore di aspirapolverisu MedicalOutline.com, un sito UAIN che ha promosso rimedi naturali per la salute non comprovati e potenzialmente dannosi, con titoli come “Il limone può curare l’allergia della pelle?”, “Quali sono i 5 rimedi naturali per l’ADHD?” e “Come si può prevenire il cancro in modo naturale”.

Google, la principale azienda di tecnologia pubblicitaria che alimenta la macchina dei siti ‘UAIN’

Le politiche pubblicitarie di Google stabiliscono che i siti non possono inserire annunci forniti dall’azienda su pagine che includono “contenuti di spam generati automaticamente”, anche definiti come “contenuti creati in modo programmatico senza produrre nulla di originale o apportare un valore aggiunto sufficiente”.

Tuttavia, come già accennato, più del 90% degli annunci che NewsGuard ha identificato sui siti UAIN sono stati forniti da Google Ads. NewsGuard ha inviato quattro email a Google chiedendo un commento sulla monetizzazione dei siti UAIN. Dopo aver ricevuto l’email di NewsGuard, un portavoce di Google ha chiesto via email maggiori informazioni sulla ricerca, richiesta che NewsGuard ha soddisfatto. Tuttavia, al 22 giugno 2023, NewsGuard non ha ricevuto risposta.

Alcuni dei siti UAIN su cui sono apparse le inserzioni di grandi marchi pubblicano centinaia di articoli al giorno, apparentemente con l’aiuto di un chatbot (è spesso difficile capire se un articolo è stato scritto con l’aiuto dell’intelligenza artificiale se non include i messaggi di errore che si trovano comunemente nei testi generati dall’IA).

Ad esempio, World-Today-News.com, sito non affidabile generato dall’IA che si occupa di notizie e lifestyle, ha pubblicato circa 8.600 articoli – una media di circa 1.200 al giorno – nella settimana compresa tra il 9 e il 15 giugno 2023. In confronto, il New York Times pubblica in genere circa 150 articoli al giorno, secondo un Q&A dell’aprile 2022. Sul sito appena menzionato, i cui articoli non sono firmati e che non fornisce informazioni sulla sua direzione editoriale, NewsGuard ha trovato annunci programmatici di una compagnia aerea statunitense, di una piattaforma di e-commerce e di un grande magazzino statunitense. Il già citato sito UAIN AlaskaCommons.com e Time.news, altro sito inaffidabile generato da IA, hanno pubblicato rispettivamente 5.867 e 6.108 articoli nello stesso periodo, secondo quanto rilevato da NewsGuard.

Mentre Time.news, che pubblica notizie internazionali, non fornisce i nomi dei suoi autori, AlaskaCommons.com attribuisce regolarmente i suoi articoli a quelli che sembrerebbero essere una serie di profili di autori non autentici. “Ingrid Taylor”, uno dei nomi spesso utilizzati per firmare i contenuti, ha pubblicato 4.364 articoli dall’inizio di quest’anno, di cui 108 solo il 15 giugno 2023. Come già detto, su AlaskaCommons.com NewsGuard ha trovato annunci di un sito di affitto di appartamenti negli Stati Uniti, di un sito di e-commerce, di una stampante per ufficio giapponese e di un produttore di elettronica cinese. Su Time.news, invece, gli analisti di NewsGuard hanno trovato annunci di due grandi banche statunitensi, di un servizio di musica online, di un’azienda di abbigliamento sportivo, di un’azienda di media della Silicon Valley e di altre aziende ancora.

Su altri siti UAIN, gli analisti di NewsGuard hanno visualizzato almeno una decina di widget pubblicitari su articoli che presentavano messaggi di errore generati dall’IA. I widget pubblicitari sono pezzi di codice che i programmatori possono inserire nei loro siti per pubblicare annunci programmatici. Google non sembrerebbe mettere limiti al numero di widget pubblicitari che un sito può inserire in una determinata pagina, secondo quanto spiega il Centro di assistenza sul sito dell’azienda.

Un articolo prodotto dall’intelligenza artificiale e contenente un messaggio di errore generato da un chatbot sul sito UAIN FoodingWorld.com – sito che pubblica informazioni sulla storia e gli ingredienti degli alimenti – conteneva 15 widget pubblicitari di Google Ads. Gli annunci che NewsGuard ha visualizzato sul sito promuovevano, tra gli altri, una società internazionale di noleggio auto, una banca statunitense, un rivenditore di materassi e un’azienda di e-commerce.

Intelligenza Artificiale: i grandi marchi finanziano "content farm" di notizie inaffidabili
Annunci di una società di noleggio auto su FoodingWorld.com, un sito UAIN che pubblica articoli generati dall’intelligenza artificiale sul cibo. NewsGuard ha oscurato le inserzioni pubblicitarie. (Screenshot di NewsGuard)

È facile per i siti UAIN, proprio come per qualsiasi altro sito, monetizzare rapidamente i propri contenuti. Sulla landing page di Google AdSense, il nome dei widget pubblicitari che Google fornisce agli editori, l’azienda sottolinea la facilità con cui i siti possono iniziare a guadagnare con gli annunci programmatici: “Tutto quello che devi fare è inserire il breve codice AdSense nel tuo sito, e AdSense inizia immediatamente a funzionare”.

Da quando ha iniziato a tracciare la diffusione dei siti UAIN nel maggio 2023, NewsGuard ha identificato circa 25 nuovi siti alla settimana. Il numero totale di UAIN è probabilmente di gran lunga maggiore dei 217 siti identificati al momento da NewsGuard perché gli analisti sono in grado di individuare i siti di notizie inaffidabili prodotti dall’intelligenza artificiale solo se questi ultimi hanno pubblicato articoli contenenti messaggi di errore generati da modelli di linguaggio IA.

NewsGuard ha inviato un’email a 40 dei 141 brand le cui inserzioni pubblicitarie sono state individuate su siti UAIN, chiedendo se fossero a conoscenza del fatto che i loro annunci compaiono su siti inaffidabili generati dall’intelligenza artificiale. Quattro brand hanno risposto ma si sono rifiutati di commentare.

NewsGuard ha anche contattato via email quattro dei sei siti UAIN citati in questo report, chiedendo informazioni sul loro utilizzo dell’IA e sui messaggi di errore presenti nei loro articoli. Nessuno dei siti ha risposto alle email. NewsGuard non è stato in grado di trovare le informazioni di contatto degli altri due siti UAIN, NoticiasDeEmprego.com.br e AlaskaCommons.com.

Nota: NewsGuard concede in licenza le sue valutazioni di oltre 30.000 fonti di notizie e informazioni, tra cui più di 9.000 siti, per aiutare i marchi a evitare di inserire involontariamente annunci pubblicitari programmatici su siti di misinformazione e di bassa qualità. Gli elenchi di esclusione di NewsGuard vengono utilizzati da inserzionisti, agenzie pubblicitarie e società di tecnologia pubblicitaria per evitare che sui siti indicati vengano pubblicati annunci, mentre gli elenchi di inclusione di NewsGuard vengono utilizzati per inserire pubblicità su siti generalmente affidabili, sostenendo il giornalismo di qualità.

Metodologia:

Nei mesi di maggio e giugno 2023, alcuni analisti di NewsGuard con sede negli Stati Uniti, in Germania, Francia e Italia hanno esaminato 55 siti su cui appare pubblicità programmatica e che soddisfano i criteri di NewsGuard relativi alla definizione di ‘notizie inaffidabili generate dall’intelligenza artificiale’ (vedi sotto). Gli analisti hanno utilizzato diversi browser, modalità di navigazione privata e reti private virtuali (VPN), uno strumento che consente agli utenti di navigare in Internet come se si trovassero in un altro Paese. Gli analisti hanno poi raccolto gli screenshot degli annunci visualizzati. Nel report sono state incluse solo le pubblicità di aziende con un fatturato annuo pari o superiore a 500 milioni di dollari.

NewsGuard considera UAIN i siti che soddisfano tutti e quattro questi criteri:

  1. Esistono prove inconfutabili che una parte sostanziale dei contenuti del sito è prodotta dall’IA.
  2. Ci sono prove certe che i contenuti vengono pubblicati senza una significativa supervisione umana. Ad esempio, numerosi articoli contengono messaggi di errore o altre formule tipiche delle risposte dei chatbot, dimostrando dunque che il contenuto è stato prodotto da strumenti di IA senza un adeguato controllo. (È probabile che già oggi o in futuro molti siti di notizie si servano di strumenti di IA, ma a ciò uniscano anche un’efficace supervisione umana; questi siti non saranno considerati UAIN).
  3. Il modo in cui il sito si presenta potrebbe indurre il lettore medio a credere che i suoi contenuti siano prodotti da scrittori o giornalisti umani, perché ha un nome generico o innocuo, e l’aspetto o altri contenuti tipici dei siti di notizie e informazioni tradizionali.
  4. Il sito non rivela chiaramente che i suoi contenuti sono prodotti da IA.