Quando la conoscenza sfugge al digitale: i limiti nascosti dell’IA

Negli ultimi anni, le intelligenze artificiali generative — come quelle basate su modelli di linguaggio — sono diventate per molte persone il principale strumento per informarsi, imparare, orientarsi. Ma la convinzione che un’IA rappresenti un archivio universale e neutrale di conoscenza umana è profondamente illusoria. Nel suo saggio “Huge swathes of human knowledge are missing from the internet”, Deepak Varuvel Dennison ci ricorda che gran parte del sapere umano resta fuori dalla rete — e dunque invisibile agli algoritmi.
Il “buco” nel web: conoscenze invisibili ad internet
Dennison ricorda che internet — e, dunque, le IA addestrate su internet — tende a riprodurre un tipo di conoscenza dominato da lingue e tradizioni culturali “digitalmente presenti”, ignorando intere porzioni di sapere locale, orale, tradizionale.
- Le lingue “globali” — soprattutto l’inglese — occupano la gran parte dei dati digitali. Un dato citato dal saggio: nel dataset pubblico Common Crawl, l’inglese rappresenta circa il 44% del contenuto, mentre lingue molto diffuse come l’hindi o il tamil — parlate da milioni di persone — sono grossolanamente sottorappresentate.
- Di conseguenza, pratiche tradizionali, conoscenze indigene, saperi costruiti oralmente o localmente, rimangono invisibili: medicina tradizionale, conoscenze ecologiche, architettura vernacolare, gestione del territorio, cultura popolare.
In altre parole: ciò che non è mai stato “messo online” — o documentato in testi accessibili — è di fatto perso per le IA.
Modelli statistici, non “intelligenze” globali
Le IA generative non “capiscono” la conoscenza come un essere umano: piuttosto, cercano pattern statistici all’interno dei dati su cui sono state addestrate. Questo significa che concetti, idee, vocaboli e pratiche più frequenti o maggiormente documentati tendono a essere amplificati; tutto ciò che è raro, locale, poco citato, viene trascurato o ignorato.
Questo comportamento porta a due rischi gravi:
- Amplificazione delle conoscenze globalizzate — idee, culture, valori dominanti (spesso occidentali o “occidentalizzati”) diventano la norma, presentate come universali.
- Erosione del sapere marginale — sapere tradizionale, orale, locale, minoranze linguistiche non rappresentate nei dati digitali rischiano di scomparire, in un processo silenzioso che oggi viene accelerato dalla “mediazione AI”.
Il pericolo del “collasso del sapere”
Dennison parla esplicitamente di quello che alcuni ricercatori — come Andrew Peterson — definiscono “knowledge collapse”: una progressiva riduzione della diversità delle conoscenze accessibili grazie all’uso sempre più massiccio e ripetuto di IA che attingono e rigenerano sempre gli stessi contenuti digitali.
Questo fenomeno non è solo un problema di rappresentatività o di equità: è anche un rischio per la resilienza culturale ed ecologica del pianeta. Molti saperi locali — tradizioni di costruzione, riconoscimento di piante medicinali, ecologie vernacolari, pratiche agricole sostenibili — sono il frutto di generazioni e di un profondo legame con territori specifici. Se questi saperi non vengono valorizzati, documentati e trasmessi, rischiano di andare perduti.
GenAI non è (ancora) una “mente umana”: ma possiamo plasmare il suo impatto
È importante sottolineare che il problema non è l’esistenza dell’IA generativa in sé — ma il modo in cui la stiamo sviluppando, utilizzando e considerandola. Come sottolinea Dennison, dietro le attuali IA ci sono squilibri strutturali: dataset dominati da lingue occidentali, sistemi che valorizzano solo conoscenze “accademiche” o “documentate”, pratiche di addestramento che privilegiano dati già prevalenti.
In più, la spinta commerciale, economica e sociale verso lo standard globale — soprattutto per uso professionale — rafforza la tendenza a vedere certe conoscenze come “standard” e altre come “esotiche”, marginali o irrilevanti.
Ma non tutto è perduto. Decolonizzare l’IA — cioè costruire dataset e modelli che tengano conto della diversità linguistica, culturale e territoriale del mondo — non è un sogno utopico. Certo, è una sfida enorme. E richiede impegno, consapevolezza e volontà politica e sociale. Dennison invita a non fermarsi a un uso passivo di GenAI, ma a perseguire un approccio critico, curioso, attento.
Perché questo tema interessa anche noi, in Italia e in Europa
Anche se l’articolo di Dennison parte da esempi nel contesto dell’India o di paesi non occidentali, le questioni che solleva riguardano direttamente la costruzione culturale della conoscenza in un mondo globalizzato — e quindi anche contesti come quello europeo.
- In Europa convivono decine di lingue, dialetti, tradizioni culturali e locali: se affidiamo la conservazione del sapere solo a dataset digitali dominati da poche lingue, rischiamo di perdere patrimonio culturale e linguistico.
- In un’epoca in cui l’IA viene proposta come strumento educativo, informativo e persino “autorevole”, vale la pena chiedersi: quali prospettive di conoscenza vengono offerte a chi si affida all’IA? E quali vengono ignorate?
- Se la sostenibilità — ambientale, sociale, culturale — richiede conoscenze radicate nei territori e nelle comunità, la standardizzazione globale guidata dall’IA rischia di rendere invisibili soluzioni locali, ecologie vernacolari, tradizioni resilienti.
Conclusione: tra opportunità e responsabilità
L’adozione massiccia di IA generativa rappresenta una svolta tecnologica di dimensioni epocali — ma rischia di essere un’arma a doppio taglio: da un lato, offre strumenti potenti per generare testi, idee, connessioni; dall’altro, rischia di omogeneizzare la conoscenza, marginalizzare culture, lingue e saperi locali, e rendere invisibili vaste aree di esperienza umana.
Se vogliamo che l’IA non assomigli a un gigantesco “contenitore monolitico di idee globali”, dobbiamo fare in modo che dia spazio anche alla pluralità, all’eterogeneità, alla complessità — cioè a ciò che rende la conoscenza umana davvero ricca.
Come dice Dennison, l’intelligenza di cui abbiamo bisogno non è solo quella di macchine super-potenti: è la capacità di vedere oltre le gerarchie del sapere, di ascoltare chi è stato escluso, di valorizzare saperi nascosti.
________________________________________
Riferimento
Varuvel Dennison D. — Huge swathes of human knowledge are missing from the internet. By definition, generative AI is shockingly ignorant too, Aeon, 2025.
