AI Watchtower

AI Watchtower est une veille critique sur la sécurité des systèmes d’IA. Chaque entrée part d’un morceau de recherche en cours — injection de prompts directe et indirecte, failles dans les serveurs MCP, modèles de menace pour les agents, arbitrages concrets de durcissement — et le traduit en consignes actionnables pour les concepteurs et opérateurs d’assistants LLM.

Le format est court, structuré, opérationnel : une analyse, une grille de risque, une checklist applicable le jour même.

Articles ci-dessous.

Claude Desktop — Durcissement simple : ce à quoi Claude ne doit PAS avoir accès

Réduction de surface ciblée sur Claude Desktop. Principe simple : c’est un assistant conversationnel, pas un agent système. Liste des « non », liste des « oui », checklist 30 minutes.

27 avril 2026 · 11 min · 2149 mots · aleph-beth