Google ha anunciado que su nuevo sistema de detección de errores basado en inteligencia artificial ha encontrado su primer conjunto de vulnerabilidades de seguridad. En total, 20 fallos fueron identificados por su agente automatizado Big Sleep, desarrollado por DeepMind en colaboración con el equipo de seguridad Project Zero.
La IA encuentra fallos reales, pero con verificación humana
Las vulnerabilidades se detectaron en proyectos populares de código abierto como FFmpeg y ImageMagick. Por el momento, Google no ha ofrecido detalles técnicos sobre el impacto o la gravedad de los fallos, ya que todavía no han sido corregidos. La empresa sigue el protocolo habitual de esperar a que se publiquen los parches antes de hacer públicos los detalles.
Lo relevante, según Google, es que estas vulnerabilidades fueron encontradas y reproducidas por la IA sin intervención humana directa. No obstante, cada informe fue revisado por un experto antes de ser enviado, con el fin de garantizar su calidad y relevancia.
El vicepresidente de ingeniería de Google, Royal Hansen, señaló a TechCrunch que esto marca “una nueva frontera en el descubrimiento automatizado de vulnerabilidades”. Big Sleep se suma a otras herramientas como RunSybil o XBOW, que también utilizan modelos de lenguaje para identificar errores de seguridad. Sin embargo, algunos desarrolladores han advertido que estas herramientas pueden generar informes falsos o poco útiles, un fenómeno comparado con las “alucinaciones” típicas de los modelos de IA.

