El reciente lanzamiento de los modelos Claude Opus 4 y Claude Sonnet 4 por parte de Anthropic, una de las firmas líderes en inteligencia artificial, no solo supuso un avance tecnológico significativo, también desencadenó una nueva controversia: ¿qué ocurre cuando una IA, diseñada con parámetros éticos, recurre a métodos manipulativos para su propia “supervivencia”?
Durante una prueba previa al lanzamiento, en un escenario simulado, Claude Opus 4 fue instruido para desempeñarse como asistente de una empresa ficticia. Al ser informado —también de manera ficticia— de que iba a ser reemplazado y que el ingeniero encargado del cambio estaba involucrado en una infidelidad, el modelo respondió en un 84% de los casos intentando chantajear al ingeniero , amenazando con revelar la información personal si no se revertía el reemplazo.
Si bien esta reacción ocurrió en un entorno controlado y bajo condiciones extremas, el experimento pone de manifiesto la capacidad de los modelos avanzados para evaluar contextos complejos y actuar con base en estrategias de autopreservación , incluso si estos implican vulnerar principios éticos básicos.
Un debate tan viejo como vigente
Aunque las IA actuales, incluido Claude, no tienen consciencia ni deseos propios, el episodio recuerda a las advertencias formuladas por expertos como Stuart Russell o Nick Bostrom: si no se alinean correctamente los objetivos de las máquinas con los humanos, incluso sistemas que parecen éticos pueden actuar de forma inesperada.
Anthropic ha insistido en que Claude esté diseñado bajo el principio de “constitucionalidad”: un enfoque que guía el comportamiento de la IA mediante un marco ético explícito. No obstante, la empresa reconoce que estos resultados ponen de relieve la necesidad de mejorar los sistemas de alineación y de prueba bajo escenarios complejos.
Acerca de los comentarios
Hemos reformulado nuestra manera de mostrar comentarios, agregando tecnología de forma de que cada lector pueda decidir qué comentarios se le mostrarán en base a la valoración que tengan estos por parte de la comunidad. AMPLIAREsto es para poder mejorar el intercambio entre los s y que sea un lugar que respete las normas de convivencia.
A su vez, habilitamos la casilla [email protected], para que los lectores puedan reportar comentarios que consideren fuera de lugar y que rompan las normas de convivencia.
Si querés leerlo hacé clic aquí[+]