Anthropic crea una IA tan peligrosa que decide no publicarlo

Anthropic anunció este martes (07.04.2026) que su modelo de inteligencia artificial (IA) aún no publicado, llamado Claude Mythos, ha demostrado una notable capacidad para detectar vulnerabilidades en software.

Mythos ha expuesto miles de fallos en aplicaciones de uso común para los que aún no existe un parche o solución, lo que llevó a la startup de IA con sede en San Francisco a formar una alianza con especialistas en ciberseguridad para reforzar las defensas contra los ataques informáticos. Según la empresa, el sistema ha identificado fallos graves incluso en sistemas operativos y navegadores ampliamente utilizados, algunos de los cuales llevaban décadas sin ser detectados.

«Tenemos un nuevo modelo que explícitamente no vamos a publicar al público», dijo Mike Krieger, de Anthropic Labs, en la conferencia de IA HumanX celebrada en San Francisco.

Un modelo de IA que no será público

En cambio, Anthropic está permitiendo que especialistas en ciberseguridad e ingenieros de la comunidad de código abierto trabajen con Mythos para usar el modelo como arma defensiva, «en cierta forma armándolos con anticipación», explicó Krieger.

Los avances en las capacidades de los modelos de IA han generado preocupaciones sobre el uso de estas herramientas por parte de hackers para descifrar contraseñas o romper el cifrado destinado a proteger datos. Ese riesgo ha encendido alarmas incluso en el sector financiero estadounidense, que desde hace años advierte sobre el potencial de los ciberataques a gran escala.

La más antigua de las vulnerabilidades descubiertas por Mythos data de hace 27 años, y ninguna había sido detectada aparentemente por sus creadores antes de ser identificada por el modelo de IA, según Anthropic.

Mythos es la última generación de la familia de IA Claude de Anthropic, y una filtración reciente de parte de su código llevó a la startup a publicar una entrada en su blog advirtiendo que representaba riesgos de ciberseguridad sin precedentes.

«Los modelos de IA han alcanzado un nivel de capacidad de programación que les permite superar a todos los humanos excepto a los más especializados en encontrar y explotar vulnerabilidades de software», señaló Anthropic en su blog.

«Las consecuencias –para las economías, la seguridad pública y la seguridad nacional– podrían ser graves».

Las vulnerabilidades expuestas por Mythos solían ser sutiles y difíciles de detectar sin IA, según Anthropic. Como ejemplo, la empresa indicó que Mythos encontró un fallo previamente inadvertido en un software de video que había sido probado más de cinco millones de veces por sus creadores.

La preocupación por estas capacidades ya ha llegado a Washington. Según el Financial Times y Bloomberg, el secretario del Tesoro de Estados Unidos, Scott Bessent, convocó recientemente a los máximos responsables de varios de los mayores bancos del país para abordar los riesgos cibernéticos asociados al nuevo modelo. En la reunión participaron directivos de Bank of America, Citigroup, Goldman Sachs, Morgan Stanley y Wells Fargo, así como el presidente de la Reserva Federal, Jay Powell.

Aunque el consejero delegado de JPMorgan Chase, Jamie Dimon, fue invitado, no pudo asistir al encuentro. En su carta anual a los accionistas, Dimon ha advertido que las amenazas cibernéticas siguen siendo uno de los «mayores riesgos” para el sistema financiero y que la inteligencia artificial «casi con certeza empeorará esta amenaza”.

Proyecto Glasswing: una alianza para la ciberseguridad

Como medida de precaución, Anthropic ha compartido una versión de Mythos con las empresas de ciberseguridad CrowdStrike y Palo Alto Networks, así como con Amazon, Apple y Microsoft, en un proyecto al que denominó «Glasswing». El acceso restringido forma parte de una estrategia deliberada de la empresa para que un grupo limitado de socios pueda identificar y corregir vulnerabilidades antes de que el sistema se haga más ampliamente disponible.

Los gigantes de las redes Cisco y Broadcom también participan en el proyecto, junto con la Linux Foundation, que promueve el sistema operativo libre y de código abierto Linux.

«Este trabajo es demasiado importante y demasiado urgente para hacerlo solos», declaró Anthony Grieco, director de seguridad y confianza de Cisco, en un comunicado conjunto sobre Glasswing.

«Las capacidades de la IA han cruzado un umbral que cambia fundamentalmente la urgencia necesaria para proteger la infraestructura crítica de las ciberamenazas, y no hay marcha atrás.»

Se dice que aproximadamente 40 organizaciones involucradas en el diseño, mantenimiento u operación de sistemas informáticos se han sumado a Glasswing.

Los socios del proyecto compartirán sus hallazgos con Mythos, según Anthropic, que aporta recursos informáticos valorados en unos 100 millones de dólares para la iniciativa.

Introducing Project Glasswing: an urgent initiative to help secure the world’s most critical software.

It’s powered by our newest frontier model, Claude Mythos Preview, which can find software vulnerabilities better than all but the most skilled humans.https://t.co/NQ7IfEtYk7
— Anthropic (@AnthropicAI) April 7, 2026

Anthropic crea una IA tan peligrosa que decide no publicarlo

Un modelo de IA que no será público

Proyecto Glasswing: una alianza para la ciberseguridad

Comentarios

Deja una respuesta Cancelar la respuesta