Escándalo. Un error humano en Anthropic dejó al descubierto más de 500 mil líneas del código fuente de Claude Code

Un fallo en el empaquetado de su software dejó accesible parte del sistema interno. La filtración expuso funciones no públicas, detalles clave de su desarrollo y proyectos secretos.

31 de marzo de 2026 a las 09:45 p. m.
Un error humano en Anthropic dejó al descubierto más de 500 mil líneas del código fuente de Claude Code
Un error humano en Anthropic dejó al descubierto más de 500 mil líneas del código fuente de Claude Code.

La empresa de inteligencia artificial Anthropic, conocida por su enfoque en la seguridad, sufrió una filtración masiva de información luego de un error humano que dejó expuesto el código fuente de su herramienta Claude Code.

El incidente ocurrió este martes y permitió el acceso a más de 512 mil líneas de código TypeScript, incluyendo funciones internas y proyectos no anunciados.

A pesar de la gravedad, la empresa aclaró que no se vieron afectados datos ni credenciales de sus clientes.

Cómo ocurrió la filtración

El problema se originó en la versión 2.1.88 del paquete de Claude Code publicada en npm, una plataforma esencial para desarrolladores.

Por un error de configuración, el archivo incluía un "mapa de fuente" (.map), una especie de traductor técnico que permite reconstruir el código original que normalmente está oculto para el público.

Ese archivo contenía un enlace directo a un contenedor de almacenamiento en la nube (Cloudflare R2) sin protección, desde donde se pudo descargar el material completo.

En pocas horas, el código fue copiado y compartido miles de veces en plataformas como GitHub.

Qué revela el código filtrado

El leak expuso el "plano de construcción" de la inteligencia artificial de Anthropic.

Entre los hallazgos más importantes se identificó un sistema de "Memoria Auto-Sanadora" (Self-Healing Memory), diseñado para evitar que la IA se confunda o contradiga en conversaciones muy largas, un problema técnico conocido como "entropía de contexto".

También aparecieron funciones avanzadas como KAIROS, un asistente que puede trabajar de forma autónoma en segundo plano mientras el usuario no está usando la computadora, y ULTRAPLAN, sesiones de planificación compleja que pueden durar hasta 30 minutos.

Modelos ocultos y el modo "encubierto"

La filtración profundizó los detalles sobre nuevos modelos. Se confirmó la potencia de "Claude Mythos" (conocido internamente como Capybara), un modelo de un nivel superior a los actuales diseñado para superar récords en programación y razonamiento.

La existencia de Mythos ya se sospechaba tras una filtración previa en el sistema web de la empresa el pasado 26 de marzo.

Además, se detectó un polémico "Modo Encubierto" (Undercover Mode). Este sistema permite que los empleados de Anthropic colaboren en proyectos públicos sin que nadie sepa que están usando una IA, borrando cualquier rastro interno de la empresa en los mensajes.

Riesgos de seguridad e impacto

Más allá de la pérdida de secretos comerciales, el incidente facilitó que actores malintencionados analicen el código para buscar debilidades.

Además, el mismo día se detectó un ataque informático en otra herramienta popular (el paquete axios), lo que aumentó el riesgo para quienes actualizaron sus sistemas en esa fecha.

El caso genera una fuerte ironía en el sector: Anthropic, la empresa que abandera la "IA segura y responsable", cayó ante un error básico de configuración manual.

Mientras los competidores podrían usar estos datos para acelerar sus propios desarrollos, la empresa ha pedido a los usuarios migrar a su nuevo instalador nativo para garantizar actualizaciones más seguras.