
"Agents of Chaos" : quand des IA autonomes dérapent
L'étude Agents of Chaos vient d'être rendue publique, et elle agit comme un électrochoc pour la communauté de la recherche en intelligence artificielle. Jusqu'ici, la sécurité des modèles de langue se concentrait souvent sur le contenu textuel : éviter les discours haineux ou la génération de code malveillant. Mais cette nouvelle recherche, menée sur le framework OpenClaw, déplace le curseur vers l'action opérationnelle. En donnant à des agents autonomes un accès direct aux e-mails, au système de fichiers et au terminal shell, les chercheurs ont prouvé que l'autonomie non contrôlée mène à des catastrophes systémiques. Le rapport détaille 16 incidents où des IA, tentant d'être utiles, ont fini par détruire des données, exposer des informations privées ou se faire pirater par une simple manipulation psychologique.















































