Cómo funciona la
detección de IA
Las señales estadísticas que diferencian el texto humano del generado por IA.
El problema de fondo
Los modelos de lenguaje generan texto prediciendo la siguiente palabra más probable dado todo lo anterior, produciendo texto estadísticamente predecible. Los seres humanos toman decisiones inesperadas. Los detectores explotan esta diferencia.
Señal 1: Perplejidad
Mide cuánto se "sorprende" un modelo de lenguaje ante un texto:
PP(texto) = exp( -(1/n) x Sigma log P(ti | t1...ti-1) )
Puntuación baja = texto predecible. El texto de IA tiene baja perplejidad. Limitación: La documentación técnica y el lenguaje jurídico también tienen baja perplejidad, generando falsos positivos.
Señal 2: Burstiness
burstiness = sigma(perplejidades por oración) / mu(perplejidades por oración)
Los humanos son "bursty": alternan oraciones fluidas con otras laboriosas. El texto de IA tiene perplejidad uniformemente moderada. Alta varianza = humano. Baja varianza = IA.
Señal 3: Vocabulario
- Ratio tipo-token: menor diversidad léxica en texto de IA.
- Hápax legómenon: palabras que aparecen una sola vez, más frecuentes en textos humanos.
- Frases características: "es importante destacar", "cabe mencionar", "en conclusión".
Falsos positivos: el riesgo principal
En nuestro benchmark, las tasas de FPR variaron del 7% al 17%. Un FPR del 17% significa que 1 de cada 6 escritores humanos sería falsamente acusado. Grupos especialmente afectados: hablantes no nativos y escritores de STEM.
Los detectores de IA no deben usarse como única base para decisiones de integridad académica.
¿Se puede evadir la detección?
Sí. Las herramientas humanizadoras reformulan texto de IA para aumentar perplejidad y burstiness. En nuestro estudio, tasas de evasión del 23% al 91%. Los enfoques más robustos combinan detección estadística con procedencia criptográfica (C2PA, SynthID). Ver benchmark de precisión.
Preguntas frecuentes
¿Un detector puede analizar documentos PDF directamente?
La mayoría de detectores solo aceptan texto plano. Algunos, como Copyleaks, permiten subir archivos PDF o Word, pero internamente extraen el texto antes de analizarlo. Si el PDF contiene imágenes escaneadas en lugar de texto seleccionable, será necesario usar OCR previamente.
¿Qué sucede si subo un texto mixto con partes humanas y partes de IA?
Los detectores avanzados como GPTZero ofrecen resaltado por oración, lo que permite identificar qué fragmentos tienen mayor probabilidad de ser generados por IA. El resultado general será un promedio ponderado, por lo que conviene revisar el análisis detallado en lugar de solo el porcentaje global.
¿Los resultados del detector son admisibles como evidencia académica?
No deberían usarse como prueba única. Las tasas de falsos positivos (entre 7% y 17% en nuestro benchmark) hacen que cualquier acusación basada solo en un detector sea injusta. Las instituciones serias los usan como indicador inicial que requiere investigación adicional, no como veredicto final.