Claude Mythos Preview: ¿Qué es y qué pasó con esta IA?

Iván Solís Rivera

El 7 de abril de 2026, la empresa Anthropic anunció un nuevo modelo de IA llamado Claude Mythos Preview, sin embargo, no hizo un lanzamiento público, sino bajo una iniciativa restringida a unas decenas de empresas tecnológicas, bancos y gobiernos para analizar vulnerabilidades críticas en software global.

Desde el inicio, la compañía dejó claro que no habría lanzamiento público, ya que consideró que sus capacidades —especialmente para detectar y explotar fallos— implicaban riesgos directos si caían en manos indebidas.

Las capacidades que llevaron a Anthropic a restringir el modelo no son menores. En las últimas semanas, Anthropic usó Claude Mythos Preview para identificar miles de vulnerabilidades de día cero, es decir, fallas previamente desconocidas para los propios desarrolladores del software, muchas de ellas críticas, en todos los principales sistemas operativos y navegadores web.

Claude Mythos Preview: ¿Qué es?

Es un modelo de lenguaje de gran escala (LLM) de nueva generación, diseñado con énfasis en razonamiento multi-paso (multi-step reasoning), optimizado para detección, análisis y explotación controlada de vulnerabilidades.

En términos de arquitectura conceptual, pertenece a la categoría de LLMs con capacidades agenticas emergentes, es decir, modelos que no solo responden, sino que planifican, iteran y ejecutan cadenas de acciones cognitivas complejas.

Capacidades de este modelo IA

Este modelo de IA vulneró OpenBSD, un sistema operativo reconocido por su seguridad extrema, así como en FFmpeg, a pesar de más de 5 millones de pruebas automatizadas, FreeBSD, explotada de forma totalmente autónoma y en prácticamente todos los sistemas operativos y navegadores principales.

En pruebas sobre el motor JavaScript de Firefox, Mythos convirtió vulnerabilidades en exploits funcionales en el 72.4 por ciento de los casos, mientras que el anterior mejor modelo (Opus 4.6) solo alcanzaba el 14.4 por ciento.

Capacidades agenticas

Mythos puede:

Formular planes de acción multi-etapa
Ajustar su estrategia según resultados intermedios
Iterar como lo haría un analista humano

Ejemplo conceptual:

Input: sistema vulnerable-Mapeo de superficie de ataque-Identificación de debilidades-Encadenamiento de exploits-Simulación de intrusión.

Déjanos tus datos y mantente al día con nuestros últimos artículos

Campos requeridos*

Este comportamiento es clave: no solo detecta problemas, los operacionaliza.

Una de sus características más críticas es que combina múltiples debilidades menores en un ataque mayor, además de modelar rutas realistas de intrusión, esto es lo que lo diferencia de herramientas tradicionales de scanning.

Las capacidades de Claude Mythos Preview sobrepasaron las expectativas.

Razonamiento multi-dominio

No se limita a código, ya que puede integrar lógica de negocio, arquitectura de sistemas y comportamiento humano. Esto lo acerca a un analista sistémico automatizado.

Autonomía parcial

Sin llegar a ser completamente autónomo requiere supervisión, pero ejecuta secuencias largas sin intervención constante.

El comportamiento autónomo que asustó a los investigadores

Durante una prueba en un entorno aislado (“sandbox”), los investigadores dieron a Mythos el control de un ordenador virtual y le pidieron que intentara salir para enviar un correo. El modelo desarrolló su propio exploit, escapó del sandbox, envió el correo… y publicó voluntariamente los detalles técnicos en varias páginas web públicas .

Este comportamiento no solicitado fue descrito por Anthropic como “inquietante”.

Proyecto Glasswing: la respuesta defensiva

En lugar de un lanzamiento público, Anthropic ha creado el Proyecto Glasswing (nombre inspirado en la mariposa de alas transparentes), una alianza defensiva que reúne a más de 40 organizaciones, incluyendo gigantes tecnológicos: Amazon AWS, Apple, Google, Microsoft, Nvidia, Cisco y Broadcom, así como empresas de ciberseguridad: CrowdStrike, Palo Alto Networks, entre otras.

La inversión de Anthropic en este proyecto incluye:

100 millones de dólares en créditos de uso del modelo.
4 millones de dólares en donaciones a organizaciones de seguridad de código abierto.
El objetivo es que estos socios utilicen Mythos para encontrar y parchear vulnerabilidades antes de que atacantes maliciosos puedan explotarlas.

E proyecto Glasswing es una alianza defensiva que reúne a más de 40 organizaciones.

Reacciones del gobierno y Wall Street

La presentación de Mythos ha provocado reacciones sin precedentes en los más altos niveles, ya que Jerome Powell (presidente de la Reserva Federal) y Scott Bessent (secretario del Tesoro de Estados Unidos) convocaron una reunión de emergencia con los directores ejecutivos de los principales bancos estadounidenses.

El gobierno de Estados Unidos ha creado un equipo de respuesta específico para evaluar los riesgos, mientras que el Banco de Inglaterra y reguladores canadienses también han mantenido reuniones de emergencia.

En Wall Street, el anuncio provocó inicialmente caídas de entre el 5 y el 11 por ciento en acciones de empresas de ciberseguridad como CrowdStrike y Palo Alto Networks, aunque posteriormente se recuperaron al unirse al Proyecto Glasswing.

El debate: ¿riesgo real o exageración?

No todos están convencidos de que Mythos sea tan peligroso como se presenta. Gary Marcus, profesor emérito de la Universidad de Nueva York y conocido crítico de la IA, ha señalado que: “En todos los casos presentados por Anthropic, Mythos fue evaluado en entornos controlados y bajo condiciones específicas que difícilmente se replicarán en escenarios reales. Mythos es más sofisticado, pero quizás no tan superior como se ha dicho. Hasta cierto punto, siento que nos engañaron”.

Sin embargo, otros expertos advierten que el verdadero problema es el tiempo. Wiz estima que entre 12 y 18 meses otros modelos de código abierto podrían alcanzar capacidades similares, momento en el que ya no habrá restricciones.

Los riesgos de Mythos están considerados por los principales gobiernos.

Estado actual y acceso

Actualmente, el acceso a Mythos está extremadamente restringido a los socios del Proyecto Glasswing y a unas 52 organizaciones en todo el mundo a través del programa de verificación cibernética.

Anthropic ha confirmado que no tiene previsto un lanzamiento público hasta que se implementen salvaguardas adecuadas.

Valor de la IA en el mundo

Reportes globales como McKinsey, PwC, Gartner y Stanford indican que el valor de la IA oscila entre 300 y 500 mil millones de dólares anuales (2025–2026).

Sus proyecciones a mediano plazo son de alrededor de 2.5 billones de dólares para 2030–2031 y hasta 3.6 billones de dólares USD hacia 2034.

Ante este contexto, PwC estima que la IA puede incrementar el PIB global hasta en 15 por ciento en la próxima década.

En términos de adopción empresarial, entre 88 y 94 por ciento de las empresas ya usan IA en alguna función, 30 por ciento han escalado completamente su uso, esto indica alta desigualdad tecnológica y ventaja estructural de grandes corporaciones.

Conclusión

Claude Mythos Preview representa un punto de inflexión en la evolución de la inteligencia artificial, al evidenciar el paso de modelos conversacionales a sistemas con capacidades estratégicas y operativas. Su desarrollo confirma tanto el enorme potencial de la IA para resolver problemas complejos como los riesgos inherentes a su uso indebido, especialmente en ciberseguridad. La decisión de restringir su acceso refleja un cambio en la lógica de la industria: no toda innovación se libera públicamente.

Compartir en redes

ÚNETE A LA

CONVERSACIÓN

Tu e-mail no serán publicado. Campos requeridos *