AI detection: cosa funziona davvero e cosa no

Aggiornato a marzo 2026 · 7 min di lettura

Il mercato dei "detector AI" è esploso. GPTZero, Originality.ai, Copyleaks, ZeroGPT e decine di altri tool promettono di identificare il testo generato da AI con accuratezze del "99%." Ma quanto sono affidabili davvero? La risposta onesta è: dipende.

Come funzionano i detector AI

Esistono due approcci principali. Il primo usa modelli di machine learning addestrati su migliaia di testi umani e AI per riconoscere pattern statistici. Il secondo (usato da RealText) si basa su metriche stilistiche algoritmiche — burstiness, varietà lessicale, pattern ripetitivi — che non richiedono un modello proprietario.

Il primo approccio è generalmente più accurato ma è una scatola nera: non puoi sapere perché un testo è stato flaggato. Il secondo è più trasparente e interpretabile, ma meno preciso sui casi limite.

Cosa funziona

Testo AI puro e non editato: quasi tutti i detector sono ragionevolmente accurati (85-95%) su testo generato direttamente da ChatGPT o simili senza nessun editing umano. I pattern sono forti e riconoscibili.

Testi lunghi: più testo c'è, più i pattern sono evidenti. Un articolo di 1000 parole è molto più facile da analizzare di un paragrafo di 100.

Metriche stilistiche specifiche: la burstiness (varianza nella lunghezza delle frasi) è probabilmente la metrica singola più affidabile. L'AI produce frasi di lunghezza straordinariamente uniforme, e questo è difficile da mascherare anche con editing leggero.

Cosa NON funziona

Testo AI editato da un umano: se qualcuno usa ChatGPT come bozza e poi riscrive sostanzialmente il testo, la detection diventa inaffidabile (50-70% di accuratezza). E questo è il caso d'uso più comune.

Scrittori non-madrelingua: chi scrive in una seconda lingua produce spesso testo "regolare" e prevedibile — proprio come l'AI. I falsi positivi su non-madrelingua sono un problema noto e grave.

Testi molto tecnici o accademici: la prosa scientifica ha naturalmente bassa burstiness e vocabolario ripetitivo. Molti detector flaggano testi accademici umani come "AI-generated."

Il "99% di accuratezza": questa cifra, usata nel marketing di molti tool, è misurata su dataset ottimali. Nel mondo reale, con testi misti e editati, le performance calano significativamente.

Come usare i detector in modo intelligente

Mai come unica prova. Un detector dovrebbe essere uno strumento informativo tra molti — come un correttore ortografico, non come un giudice. Guarda le metriche individuali (burstiness, TTR, pattern) più che lo score aggregato. E soprattutto: usa i suggerimenti per migliorare il testo, indipendentemente dallo score.

RealText mostra le metriche individuali e dà consigli concreti. Provalo.

Prova gratis →