AI detection: cosa funziona davvero e cosa no
Il mercato dei "detector AI" è esploso. GPTZero, Originality.ai, Copyleaks, ZeroGPT e decine di altri tool promettono di identificare il testo generato da AI con accuratezze del "99%." Ma quanto sono affidabili davvero? La risposta onesta è: dipende.
Come funzionano i detector AI
Esistono due approcci principali. Il primo usa modelli di machine learning addestrati su migliaia di testi umani e AI per riconoscere pattern statistici. Il secondo (usato da RealText) si basa su metriche stilistiche algoritmiche — burstiness, varietà lessicale, pattern ripetitivi — che non richiedono un modello proprietario.
Il primo approccio è generalmente più accurato ma è una scatola nera: non puoi sapere perché un testo è stato flaggato. Il secondo è più trasparente e interpretabile, ma meno preciso sui casi limite.
Cosa funziona
Testo AI puro e non editato: quasi tutti i detector sono ragionevolmente accurati (85-95%) su testo generato direttamente da ChatGPT o simili senza nessun editing umano. I pattern sono forti e riconoscibili.
Testi lunghi: più testo c'è, più i pattern sono evidenti. Un articolo di 1000 parole è molto più facile da analizzare di un paragrafo di 100.
Metriche stilistiche specifiche: la burstiness (varianza nella lunghezza delle frasi) è probabilmente la metrica singola più affidabile. L'AI produce frasi di lunghezza straordinariamente uniforme, e questo è difficile da mascherare anche con editing leggero.
Cosa NON funziona
Testo AI editato da un umano: se qualcuno usa ChatGPT come bozza e poi riscrive sostanzialmente il testo, la detection diventa inaffidabile (50-70% di accuratezza). E questo è il caso d'uso più comune.
Scrittori non-madrelingua: chi scrive in una seconda lingua produce spesso testo "regolare" e prevedibile — proprio come l'AI. I falsi positivi su non-madrelingua sono un problema noto e grave.
Testi molto tecnici o accademici: la prosa scientifica ha naturalmente bassa burstiness e vocabolario ripetitivo. Molti detector flaggano testi accademici umani come "AI-generated."
Il "99% di accuratezza": questa cifra, usata nel marketing di molti tool, è misurata su dataset ottimali. Nel mondo reale, con testi misti e editati, le performance calano significativamente.
Come usare i detector in modo intelligente
Mai come unica prova. Un detector dovrebbe essere uno strumento informativo tra molti — come un correttore ortografico, non come un giudice. Guarda le metriche individuali (burstiness, TTR, pattern) più che lo score aggregato. E soprattutto: usa i suggerimenti per migliorare il testo, indipendentemente dallo score.
RealText mostra le metriche individuali e dà consigli concreti. Provalo.
Prova gratis →