Anthropic ha restringido el acceso público a su modelo de inteligencia artificial más reciente, Claude Mythos, después de que pruebas internas demostraran que el sistema es capaz de automatizar ciberataques. La compañía confirmó que solo permitirá el acceso a un grupo reducido de organizaciones colaboradoras para evitar que esta tecnología caiga en manos de actores malintencionados.
Aunque Mythos fue diseñado para tareas generales de programación y resolución de problemas complejos, su arquitectura le permite analizar grandes volúmenes de código con una velocidad y precisión asombrosas. Durante los ensayos internos, el modelo logró identificar vulnerabilidades previamente desconocidas en navegadores y componentes de sistemas operativos de uso común. En varios casos, la IA incluso generó secuencias de ataque funcionales para explotar dichos fallos.
Riesgos de seguridad y estrategias defensivas
La capacidad de Mythos para detectar errores que habían pasado inadvertidos durante años ha atraído la atención de expertos en ciberseguridad. Según informes de Wired, el desempeño del modelo al identificar brechas de seguridad y trazar posibles rutas de ataque es comparable al de los expertos humanos en pruebas de penetración.
Los responsables de Anthropic afirmaron que los riesgos asociados a un lanzamiento sin restricciones son demasiado elevados. Advirtieron que la tecnología podría permitir que actores maliciosos comprometan infraestructuras críticas o accedan sin autorización a sistemas sensibles. Al mantener el modelo en un entorno controlado, la empresa busca supervisar su comportamiento y prevenir posibles usos indebidos.
Para contrarrestar los peligros inherentes a herramientas de análisis de código tan potentes, Anthropic ha puesto en marcha el proyecto Glasswing. Esta iniciativa se centra en la aplicación defensiva de la tecnología, alentando a las organizaciones participantes a utilizar la IA para identificar y corregir fallos de seguridad antes de que puedan ser explotados por terceros.
"El proyecto busca coordinar los esfuerzos entre empresas para detectar vulnerabilidades antes de que alguien se aproveche de ellas con fines maliciosos", señaló la compañía en su informe técnico. Los participantes del programa están utilizando actualmente Mythos para auditar sus propios sistemas y reportar los hallazgos bajo una estricta supervisión.
Anthropic no ha proporcionado una fecha para un lanzamiento más amplio del modelo. Por ahora, la empresa continúa evaluando el rendimiento del software mientras mantiene restricciones estrictas sobre quién puede interactuar con el sistema.