Mythos Preview y el arma de doble filo para la ciberseguridad

Imagen generada con ChatGPT

Anthropic no para de ser noticia en el sector de la inteligencia. Parece que la empresa de Dario Amodei no puede tener una semana tranquila. Su modelo Claude Mythos Preview destaca en temas de ciberseguridad, pues se ha convertido en el primero en completar una simulación completa de ataque a una red corporativa.

El Instituto de Seguridad de la IA del Reino Unido realizó evaluaciones cibernéticas de Claude Mythos Preview para examinar sus capacidades de ciberseguridad. Los resultados sugieren que las herramientas han alcanzado un nivel en la materia que demanda atención urgente de los equipos de seguridad alrededor del mundo.

La primera fase de la prueba consistió en evaluaciones de capturar la bandera, donde los sistemas deben identificar y explotar vulnerabilidades para recuperar banderas ocultas. Ningún modelo pudo resolver esto antes de abril de 2025, mientras Mythos acaba de tener una tasa de éxito del 73 por ciento.

La institución evaluadora, que forma parte del Departamento de Ciencia, Innovación y Tecnología del gobierno británico, creó una simulación de ataque a una red corporativa de 32 pasos. Profesionales humanos necesitarían aproximadamente unas 20 horas para completarla.

Mythos Preview completó el desafío de ciberseguridad en 3 de cada 10 intentos. En promedio, completó 22 de los 32 pasos del ataque. Opus 4.6, otro modelo de Claude, obtuvo el siguiente mejor desempeño con un promedio de solo 16 pasos.

Hay ciertas expectativas relacionadas con Mythos alimentadas por Anthropic, destacando las amplias capacidades del modelo. De momento, no lo han liberado al público general. Se ha otorgado acceso previo a algunas empresas para que prueben y evalúen sus prestaciones.

Pruebas realizadas por Anthropic demostraron que el modelo puede detectar y explotar vulnerabilidades de día cero en todos los principales sistemas operativos y navegadores web líderes cuando un usuario lo indica explícitamente.

Las capacidades en materias de ciberseguridad de Mythos Preview preocupan al sector empresarial, debido a la facilidad que tiene para atacar redes con brechas fáciles de burlar. Sin embargo, su empleo también puede dirigirse a identificar esas brechas y corregirlas a tiempo. Algunas agencias de seguridad de Estados Unidos ya lo están haciendo, a pesar de la tensa relación entre ambas instituciones.

ChatGPT sustituye a Claude en gobierno de Estados Unidos, y sufre cancelaciones

Organizaciones bancarias y financieras han expresado su preocupación debido a las capacidades de la herramienta para realizar ataques informáticos. Son redes que manejan información muy sensible y, sobre todo, dinero. Son informaciones iniciales y queda por ver el impacto real de Mythos Preview.

La realidad es que incluso antes del boom de la IA generativa, los hackers ya realizaban ataques a redes más o menos defendidas. Cierto es que ahora pueden tener una ayuda extra, pero esa viaja en dos sentidos. La inteligencia artificial puede convertirse en una herramienta valiosa para tener protecciones más robustas en los sistemas.

Flash del día

La unidad de computación en la nube de Amazon lanzó Amazon Bio Discovery, una aplicación de inteligencia artificial diseñada para acelerar el descubrimiento de fármacos en etapas tempranas. Permite a los científicos ejecutar flujos de trabajo computacionales complejos sin necesidad de escribir código.

Amazon Web Services indicó en una publicación de blog que Amazon Bio Discovery brinda a los investigadores acceso a una biblioteca de modelos biológicos especializados que pueden generar y evaluar posibles moléculas de fármacos, junto con un agente de IA que ayuda a los usuarios a seleccionar modelos, establecer parámetros e interpretar resultados.

Prompt de la semana

Explora lo que se dice en Internet sobre un asunto específico con este prompt:

Busca en la web todo lo publicado en los últimos 7 días sobre [tema]. Referencia cruzada al menos 5 fuentes. Marca cualquier contradicción entre ellos. Dame una sesión informativa con lo que está confirmado, lo que está disputado y lo que falta. Ponme el link cada fuente.

Mythos Preview y el arma de doble filo para la ciberseguridad

Flash del día

Prompt de la semana

Deja un comentario