Identificando Textos Generados por ChatGPT: Un Desafío en la Era de la IA
Con el creciente uso de sistemas de inteligencia artificial generativa como ChatGPT, surge la preocupación por la dificultad de distinguir entre contenido real y sintético, especialmente en ámbitos académicos donde se registran numerosos casos de es
Con el creciente uso de sistemas de inteligencia artificial generativa como ChatGPT, surge la preocupación por la dificultad de distinguir entre contenido real y sintético, especialmente en ámbitos académicos donde se registran numerosos casos de estudiantes entregando trabajos generados por estos modelos.
Identificación de Textos Generados por ChatGPT
A diferencia del contenido audiovisual, identificar textos generados por ChatGPT presenta mayores desafíos. Aunque se han desarrollado herramientas para detectar estos escritos, muchas de ellas no son efectivas en la mayoría de los casos, lo que subraya la importancia del discernimiento humano.
El Método de Fareed Khan
Fareed Khan, un investigador en ciencia de datos, abordó este desafío analizando las palabras más comunes utilizadas por ChatGPT en los textos que genera. Utilizó una amplia base de datos de textos publicados en blogs, recopilando 19 mil millones de palabras.
Palabras Reveladoras
Khan identificó palabras como «delve» («ahondar»), que ha experimentado un crecimiento exponencial desde la aparición de ChatGPT. Otras palabras como «unmavering» («inquebrantable»), «pivotal» («esencial»), «nanscent» («naciente») e «intricacies» («complejidades») también se repiten con frecuencia en los textos generados.
¿Qué Significa Esto?
Estas palabras, y otras 100 identificadas por Khan, pueden servir como pistas para detectar textos generados por ChatGPT. Aunque no proporcionan una solución definitiva, ofrecen una dirección para quienes buscan identificar contenido sintético en textos escritos.