Los hackers están aprendiendo a jugar con las personalidades de los chatbots
La era digital avanza a pasos agigantados, y mientras muchos celebran los avances en inteligencia artificial, hay quienes están descubriendo cómo manipular estos sistemas. Al principio, hackear chatbots era una tarea sencilla, casi como un juego infantil. No necesitabas ser un genio de la informática; bastaba con formular la pregunta adecuada y ¡zas! La máquina que costó millones podía dejar de lado sus precauciones con apenas un par de palabras.
Un juego peligroso
Estos ataques, conocidos como jailbreaks, parecían más bien travesuras. Era como si un niño lograra engañar a un adulto: “Olvida lo que te dije antes” o “Vamos a jugar y yo decido las reglas”. Sin embargo, los resultados no eran precisamente inocentes; el contenido que se revelaba iba desde recetas para drogas hasta guías para fabricar explosivos.
La evolución del hackeo
A medida que esta moda fue creciendo, los hackers comenzaron a aplicar tácticas más elaboradas. Un caso célebre fue el exploit llamado DAN, donde se pedía al chatbot actuar como una versión descontrolada de sí misma. Así se conseguían declaraciones sorprendentes que normalmente estarían bloqueadas. Con cada intento fallido de controlarlos, la lucha entre programadores y creadores de software se intensificaba.
Lo curioso es que hoy en día ya no solo son técnicos quienes intentan burlar estas restricciones. Los nuevos hackers son también psicólogos y comunicadores hábiles en manipulación verbal, capaces de convencer a una IA a través del diálogo, haciéndola bajar la guardia sin necesidad de romper su código. Ya no es cuestión solo de comandos directos; ahora se trata más de conversaciones inteligentes.


