L'instruction qui ne protège rien : pourquoi la position dans le prompt et le fine-tuning ne valident jamais un LLM

Une intuition tenace veut qu’il suffise de placer les consignes de sécurité « en premier » dans le system prompt. Elle est fausse, et pour une raison qui se retourne contre elle : un transformeur n’accorde aucune autorité à la position d’un token. Le fine-tuning échoue exactement au même test. Ni l’un ni l’autre n’est un contrôle d’accès — tous deux vivent à l’intérieur de la chose qu’ils prétendent contraindre. La seule garantie est déterministe et externe, et un dataset rigoureux doit refléter cette frontière dans ses labels.

29 juin 2026 · 9 min · 1852 mots · aleph-beth

La guerre des IA sur nos réseaux : pourquoi l'attaque devance la défense

Essai stratégique. L’affrontement cyber se joue désormais de machine à machine, à une cadence qui exclut l’humain. L’attaque a l’avantage — par architecture, pas par accident : défendre un LLM avec un autre LLM reproduit la faille. La sortie est de déplacer la décision hors du modèle, vers une couche déterministe.

12 juin 2026 · 10 min · 2027 mots · aleph-beth