IA. Anthropic investiga un acceso no autorizado a su modelo más potente Claude Mythos Preview
La empresa confirmó que un grupo reducido logró ingresar a través de un proveedor externo. El modelo, con capacidades nunca antes vistas para encontrar vulnerabilidades, no está disponible al público por sus riesgos.
Anthropic investiga un presunto acceso no autorizado a Claude Mythos Preview, su modelo de inteligencia artificial más avanzado y restringido, tras un reporte de Bloomberg que indica que un grupo reducido de usuarios logró acceder al sistema.
Según confirmó la compañía, el incidente habría ocurrido a través de uno de los entornos de un proveedor externo, sin que hasta el momento existan pruebas de una vulneración directa de sus sistemas principales.
Cómo se produjo el acceso
De acuerdo al reporte de Bloomberg, el grupo, que operaba desde un canal privado de Discord, combinó distintos métodos para acceder al modelo.
Entre ellos, habrían adivinado la URL del sistema basándose en patrones previos, utilizado credenciales de un contratista externo de Anthropic y aprovechado datos filtrados en una brecha reciente de otra empresa.
Qué es Mythos y por qué preocupa
Claude Mythos es un modelo orientado a la ciberseguridad con capacidades avanzadas para detectar y explotar vulnerabilidades en sistemas informáticos.
Por su potencial, Anthropic decidió no lanzarlo al público general y restringió su acceso a través de un programa controlado con socios seleccionados llamado "Project Glasswind".
Riesgos y advertencias
El modelo fue señalado por organismos especializados como un “salto cualitativo” en este campo, capaz de ejecutar simulaciones complejas de ataques cibernéticos en menos tiempo que expertos humanos.
Esto generó preocupación entre autoridades y reguladores, que advierten sobre el impacto que podría tener si herramientas de este tipo caen en manos indebidas.
Estado de la investigación
Desde Anthropic indicaron que continúan analizando el incidente y remarcaron que, por ahora, no hay evidencia de un compromiso de sus sistemas internos.
Según los reportes, los usuarios que accedieron al modelo no lo habrían utilizado con fines maliciosos, sino para pruebas básicas, aunque el episodio encendió alarmas sobre la seguridad en entornos vinculados a inteligencia artificial avanzada.


