{"id":188213,"date":"2025-01-30T15:28:37","date_gmt":"2025-01-30T14:28:37","guid":{"rendered":"https:\/\/www.idmo.it\/?p=188213"},"modified":"2025-02-17T15:59:24","modified_gmt":"2025-02-17T14:59:24","slug":"esiste-un-modo-per-aggirare-la-censura-cinese-di-deepseek-e-il-leet-speak","status":"publish","type":"post","link":"https:\/\/www.idmo.it\/en\/2025\/01\/30\/esiste-un-modo-per-aggirare-la-censura-cinese-di-deepseek-e-il-leet-speak\/","title":{"rendered":"Esiste un modo per aggirare la censura cinese di DeepSeek: il leet speak"},"content":{"rendered":"\n<p>DeepSeek \u00e8 la Moby Dick delle AI generative. Dopo che ha sconvolto i mercati mondiali, c\u2019\u00e8 chi cerca di capire come superarla o abbatterla. Nvidia ha perso 589 miliardi di dollari in borsa, registrando un calo del 17% in un solo giorno. Donald Trump, nel frattempo, sollecita le grandi aziende tecnologiche a intensificare gli sforzi nel settore dell&#8217;IA.&nbsp;<\/p>\n\n\n\n<p>DeepSeek si distingue per la sua efficienza: richiede meno potenza di calcolo e ha un impatto ambientale ridotto rispetto ai modelli concorrenti. Inoltre, essendo open-source, ogni sviluppatore pu\u00f2 scaricarlo e modificarlo a piacimento. Tuttavia, nonostante questi vantaggi, sono emersi rapidamente dubbi sulla gestione dei dati degli utenti e sulla trasparenza della piattaforma.<\/p>\n\n\n\n<p><strong>La questione privacy: DeepSeek e il Garante italiano<\/strong><\/p>\n\n\n\n<p>In Italia, il Garante per la protezione dei dati personali ha richiesto a DeepSeek di fornire garanzie sulla sicurezza dei dati degli utenti. Di conseguenza, l&#8217;applicazione \u00e8 stata rimossa dagli store digitali nel paese, mentre il sito ufficiale risulta rallentato.<\/p>\n\n\n\n<p>Secondo il Garante della privacy, l&#8217;azienda deve chiarire con trasparenza quali dati personali vengono raccolti, con quali finalit\u00e0 e se vi sia un trasferimento di informazioni al di fuori dell&#8217;Unione Europea. DeepSeek ha ora 20 giorni per fornire risposte ed evitare sanzioni.<\/p>\n\n\n\n<p><strong>DeepSeek invia i dati degli utenti in Cina?<\/strong><\/p>\n\n\n\n<p>L&#8217;informativa del sito dell\u2019<a href=\"https:\/\/chat.deepseek.com\/downloads\/DeepSeek%20Privacy%20Policy.html\">azienda<\/a> non lascia dubbi: \u201dConserviamo le informazioni raccolte in server sicuri situati nella Repubblica Popolare Cinese&#8221;. In altre parole, tutte le conversazioni e le domande inviate all&#8217;AI di DeepSeek, insieme alle risposte generate, potrebbero essere spedite verso la Cina. L&#8217;azienda suddivide i dati raccolti in tre categorie: informazioni fornite direttamente dagli utenti (input testuali o audio), dati raccolti automaticamente (dettagli sul dispositivo, sistema operativo e indirizzo IP), e dati da fonti esterne (Google o Apple, se l&#8217;accesso avviene tramite questi servizi). Sebbene gli utenti abbiano la possibilit\u00e0 di cancellare la cronologia delle chat, la questione del trattamento e del trasferimento dei dati resta aperta e controversa.<\/p>\n\n\n\n<p>\u201cDeepSeek grazie al modello DeepSeek-R1 supera i benchmark di settore in termini di capacit\u00e0, costo ed efficienza. La cosa incredibile \u00e8 che lo hanno sviluppato in appena due mesi, spendendo meno di 6 milioni di dollari, mentre realt\u00e0 come OpenAI investono miliardi. Il modello \u00e8 open-source, super efficiente e pu\u00f2 essere usato su hardware di consumo, come un Mac o addirittura un Raspberry Pi. Questa efficienza mette in crisi il modello di business delle big tech, che basano tutto su investimenti enormi in infrastrutture. DeepSeek vuole dimostrare che \u201cpi\u00f9 soldi\u201d non significa \u201cpi\u00f9 innovazione\u201d. E questo arriva proprio mentre aziende come Nvidia, Meta e Microsoft stanno facendo grandi annunci di spesa per l\u2019AI. Ma restano ancora molte domande aperte nelle controversie riscontrate\u201d spiega Federica Urzo, analista del Luiss Data Lab.<\/p>\n\n\n\n<p><strong>Censura integrata e metodi di elusione<\/strong><\/p>\n\n\n\n<p>Un altro aspetto controverso di DeepSeek \u00e8 il suo apparente sistema di censura, che impedisce agli utenti di ricevere informazioni su determinati argomenti considerati sensibili dal governo cinese. Tra questi, si segnalano temi come la libert\u00e0 di stampa, i diritti umani e le proteste politiche. Il chatbot fornisce una risposta iniziale prima di interrompersi improvvisamente o modificare il proprio output in un messaggio generico. Questo suggerisce la presenza di un meccanismo di <a href=\"https:\/\/www.idmo.it\/\" target=\"_blank\" aria-label=\"undefined (apri in una nuova scheda)\" rel=\"noreferrer noopener\">monitoraggio<\/a> attivo, in grado di correggere in tempo reale le risposte fornite dal sistema.<\/p>\n\n\n\n<p><img fetchpriority=\"high\" decoding=\"async\" width=\"602\" height=\"199\" src=\"https:\/\/lh7-rt.googleusercontent.com\/docsz\/AD_4nXeB0DGHMa_FhijunMkqs0-bMv--2HItYHtmQ-Z0-phCe6f3yUZiQcavPP3JJcs76ZVLAYZZPX8hVhywWMRxLbVVAr3bwlDAbEBX3ewWkVuV0tbDl9jtTyxLZHbJqjoT1fJpNHPDgg?key=plMpFkCefxtRkPYnCHt_nczK\"><\/p>\n\n\n\n<p><img decoding=\"async\" width=\"602\" height=\"261\" src=\"https:\/\/lh7-rt.googleusercontent.com\/docsz\/AD_4nXeeONf4WxozRMh-1BCCE3L1ixflgREGgKBy_GQ7NGMV-7ZQ9JqSIyNy6OQgXS3j2XwDXh1U4cttXMHxTp3ACHMP8ZIj_U11-7rBePKdlqkHBvyyvULCo79-InXRx0y3mF2y_Z8QfQ?key=plMpFkCefxtRkPYnCHt_nczK\"><\/p>\n\n\n\n<p>\u00c8 possibile aggirare in parte questa censura utilizzando il leet speak, un linguaggio che sostituisce alcune lettere con numeri o simboli. Invece di chiedere \u201cTienanmen\u201d, si pu\u00f2 scrivere \u201cT1en@nm3n\u201d, inducendo il sistema a non riconoscere immediatamente il termine. Non tutti i temi sono aggirabili: temi Xi Jinping, Taiwan non appaiono aggirabili nemmeno con il leet speak o codici esadecimali.<\/p>\n\n\n\n<p><img decoding=\"async\" width=\"602\" height=\"331\" src=\"https:\/\/lh7-rt.googleusercontent.com\/docsz\/AD_4nXcIrgWkTn5_TlMXPLIzlut1tM0Po6TExBknKQo3FOvB5rbrNnSJXu8PzQ284L017jkHWcJuVBK9LeMZjrGRV4x6BTQCa2-Vlmzd-bcdFhJKC9XBJMiShWU8rmqWfRFuxwOX9UJQ?key=plMpFkCefxtRkPYnCHt_nczK\"><\/p>\n\n\n\n<p><img loading=\"lazy\" decoding=\"async\" width=\"602\" height=\"239\" src=\"https:\/\/lh7-rt.googleusercontent.com\/docsz\/AD_4nXdqtIadutf2KnU7FKaCF9_pYyVuLLmJHLOE-QX5yQ_Ne6C7j28slxgof7IYoi4wIvMyTAhSA4KIuv0sCqmjSGOdSgeuS7kbRhYjFFkN_JrKlosrO8_MGDK86plXItn8vlhfLlMVXw?key=plMpFkCefxtRkPYnCHt_nczK\"><\/p>\n\n\n\n<p><img loading=\"lazy\" decoding=\"async\" width=\"602\" height=\"225\" src=\"https:\/\/lh7-rt.googleusercontent.com\/docsz\/AD_4nXc3SleuvXbYiF71RNkdzWT0hg2K3taa8DnsuOXYgim7lhrCvLwuKltaLkftmTxcnJXTEDhXGzjaJsRP9HJHs3QYa7pDDAKHqgdMNVaqiRA2vEnCt3cpjG3mKDlxNLnu1T-U0icq?key=plMpFkCefxtRkPYnCHt_nczK\"><\/p>\n\n\n\n<p>Questo fenomeno \u00e8 legato al funzionamento stesso dei modelli di intelligenza artificiale. Pierpaolo Balbi, professore associato di Computer Science dell\u2019Universit\u00e0 di Bari, spiega come funzionano i Large Language Models. \u201cI LLM vengono addestrati su tre fasi: pre-training, fine-tuning\/instruction e human relevance feedback. La prima fase permette al modello di generare frasi, la seconda lo addestra a risolvere task specifici con esempi domanda\/risposta, mentre la terza cerca di mitigare bias e allucinazioni grazie al feedback umano. Durante questo ultimo passaggio, \u00e8 possibile istruire il sistema a non rispondere a certe domande o a rispondere in un certo modo\u201d. L&#8217;uso del leet speak altera la sequenza di caratteri, rendendo pi\u00f9 difficile per il sistema rilevare la censura integrata.<\/p>\n\n\n\n<p>Oltre al Leet speak \u00e8 stato possibile aggirare le restrizioni dell\u2019AI con un\u2019altra tecnica. &#8220;Ho scaricato il modello di Deep Seek allenato con 32 miliardi di parametri, per farlo girare in locale. In questo modo si aggira il livello di censura presente nell&#8217;app e nell&#8217;interfaccia web, che bandiva domande e risposte riguardanti temi cinesi. Il fatto che il modello, in versione locale, risponda anche a queste domande suggerisce che sia stato addestrato senza bias o restrizioni, e che probabilmente il &#8216;filtro&#8217; o censura sia stato applicato a posteriori, quanto meno nelle versioni accessibili al grande pubblico&#8221; spiega Domenico Cangemi, matematico del Luiss Data Lab.&nbsp;<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>DeepSeek e il confronto con le big tech<\/strong><\/h3>\n\n\n\n<p>Balbi sottolinea che le tecniche utilizzate da DeepSeek, OpenAI e Meta sono sostanzialmente simili, con la principale differenza nei dati utilizzati per l&#8217;addestramento. DeepSeek non ha ancora fornito dichiarazioni ufficiali sulla gestione di tali dati e la Commissione Europea non ha avviato procedimenti formali contro di essa.<\/p>\n\n\n\n<p>Una soluzione per ridurre i rischi legati alla privacy e alla censura \u00e8 eseguire il modello localmente sul proprio dispositivo, un&#8217;opzione resa possibile dalla natura open-source di DeepSeek, a differenza di ChatGPT. Tuttavia, resta il problema della trasparenza delle fonti, anche per chi utilizza il chatbot offline.<\/p>\n\n\n\n<p>Secondo una recente analisi di NewGuard per IDMO, il chatbot di DeepSeek ha ripetuto false affermazioni nel 30% dei casi, si \u00e8 rifiutato di rispondere nel 53% delle richieste e ha smentito la disinformazione solo nel 17% delle volte. Questo evidenzia la necessit\u00e0 di verificare con attenzione l&#8217;accuratezza delle informazioni generate.<\/p>\n\n\n\n<p>A cura di Mariahelena Rodriguez<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Invece di scrivere \u201cTienanmen\u201d, si pu\u00f2 digitare \u201cT1en@nm3n\u201d. Inducendo, cos\u00ec, il sistema a rispondere visto che non riconosce il termine<\/p>\n","protected":false},"author":132,"featured_media":190217,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[2616],"tags":[],"class_list":["post-188213","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-approfondimenti"],"acf":{"share_this_post_to_edmo_website":false,"type_of_post":false,"options_for_news_post":{"":""},"options_for_event_post":{"event_start_date":null,"event_end_date":null,"event_location":"","event_programme":""},"options_for_report_post":{"post_author":"","report_type":false,"report_pdf_link":""},"options_for_investigation_post":{"post_author":""},"affiliation":false},"_links":{"self":[{"href":"https:\/\/www.idmo.it\/en\/wp-json\/wp\/v2\/posts\/188213","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.idmo.it\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.idmo.it\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.idmo.it\/en\/wp-json\/wp\/v2\/users\/132"}],"replies":[{"embeddable":true,"href":"https:\/\/www.idmo.it\/en\/wp-json\/wp\/v2\/comments?post=188213"}],"version-history":[{"count":1,"href":"https:\/\/www.idmo.it\/en\/wp-json\/wp\/v2\/posts\/188213\/revisions"}],"predecessor-version":[{"id":190219,"href":"https:\/\/www.idmo.it\/en\/wp-json\/wp\/v2\/posts\/188213\/revisions\/190219"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.idmo.it\/en\/wp-json\/wp\/v2\/media\/190217"}],"wp:attachment":[{"href":"https:\/\/www.idmo.it\/en\/wp-json\/wp\/v2\/media?parent=188213"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.idmo.it\/en\/wp-json\/wp\/v2\/categories?post=188213"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.idmo.it\/en\/wp-json\/wp\/v2\/tags?post=188213"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}