Por: Santiago Jacquat24/04/2024

Identificando Textos Generados por ChatGPT: Un Desafío en la Era de la IA

Con el creciente uso de sistemas de inteligencia artificial generativa como ChatGPT, surge la preocupación por la dificultad de distinguir entre contenido real y sintético, especialmente en ámbitos académicos donde se registran numerosos casos de es

Con el creciente uso de sistemas de inteligencia artificial generativa como ChatGPT, surge la preocupación por la dificultad de distinguir entre contenido real y sintético, especialmente en ámbitos académicos donde se registran numerosos casos de estudiantes entregando trabajos generados por estos modelos.

Identificación de Textos Generados por ChatGPT

A diferencia del contenido audiovisual, identificar textos generados por ChatGPT presenta mayores desafíos. Aunque se han desarrollado herramientas para detectar estos escritos, muchas de ellas no son efectivas en la mayoría de los casos, lo que subraya la importancia del discernimiento humano.

El Método de Fareed Khan

Fareed Khan, un investigador en ciencia de datos, abordó este desafío analizando las palabras más comunes utilizadas por ChatGPT en los textos que genera. Utilizó una amplia base de datos de textos publicados en blogs, recopilando 19 mil millones de palabras.

Palabras Reveladoras

Khan identificó palabras como «delve» («ahondar»), que ha experimentado un crecimiento exponencial desde la aparición de ChatGPT. Otras palabras como «unmavering» («inquebrantable»), «pivotal» («esencial»), «nanscent» («naciente») e «intricacies» («complejidades») también se repiten con frecuencia en los textos generados.

¿Qué Significa Esto?

Estas palabras, y otras 100 identificadas por Khan, pueden servir como pistas para detectar textos generados por ChatGPT. Aunque no proporcionan una solución definitiva, ofrecen una dirección para quienes buscan identificar contenido sintético en textos escritos.