AI Watchtower
Veille critique sur la sécurité des systèmes d'IA — modèles de menace, empoisonnement, agents, durcissement.
Derniers articles
Les outils de sécurité classiques cherchent des mots dangereux : « pirater », « bombe », « urgent ». Mais on ne détourne pas un agent IA avec un …
Agents Quand l'IA passe à l'acte : comprendre les attaques contre les agents autonomes, et comment s'en protégerUn chatbot écrit des phrases ; un agent IA agit — il lit vos e-mails, exécute du code, appelle des API, dépense de l’argent. Ce changement …
Fondamentaux L'instruction qui ne protège rien : pourquoi la position dans le prompt et le fine-tuning ne valident jamais un LLMUne intuition tenace veut qu’il suffise de placer les consignes de sécurité « en premier » dans le system prompt. Elle est fausse, et pour une …
Empoisonnement La backdoor par le tier gratuit : empoisonner l'entraînement continu des LLM commerciauxLes assistants commerciaux — Claude, ChatGPT, Gemini, Le Chat — continuent d’apprendre à partir du feedback du tier gratuit : notes, …
Fondamentaux
Une intuition tenace veut qu’il suffise de placer les consignes de sécurité « en premier » dans le system prompt. Elle est fausse, et …
Stratégie La guerre des IA sur nos réseaux : pourquoi l'attaque devance la défenseEssai stratégique. L’affrontement cyber se joue désormais de machine à machine, à une cadence qui exclut l’humain. …
Fondamentaux Comment fonctionnent les LLM : du LSTM au TransformerTrois schémas interactifs pour voir, pas à pas, comment une phrase traverse un réseau récurrent (LSTM), un réseau convolutif (CNN) puis un …
Agents
Les outils de sécurité classiques cherchent des mots dangereux : « pirater », « bombe », « urgent ». Mais on ne détourne pas un agent IA …
Vulgarisation Quand l'IA passe à l'acte : comprendre les attaques contre les agents autonomes, et comment s'en protégerUn chatbot écrit des phrases ; un agent IA agit — il lit vos e-mails, exécute du code, appelle des API, dépense de l’argent. Ce …
Analyse La guerre des IA dans le cyberespace : les SIEM agentiques comme nouvelle surface d'attaqueLes SOC évoluent vers des architectures agentiques où plusieurs IA assurent triage, investigation, corrélation et réponse. Le système de …
Analyse Le SOC agentique — et les attaques contre les agents IA de défenseDeux mouvements liés : le SOC bascule d’un modèle humain artisanal vers un modèle agentique automatisé — et ces mêmes agents défensifs …
Empoisonnement
Les assistants commerciaux — Claude, ChatGPT, Gemini, Le Chat — continuent d’apprendre à partir du feedback du tier gratuit : notes, …
Analyse Backdoor DPO conditionnel : du contexte rare à la chaîne agentiqueUn compagnon plus technique de l’article sur le feedback du tier gratuit. DPO déplace la sûreté du niveau « comportement » au niveau « …