La mesure et la clé — Le Carnet · Département des Harnais

Bruxelles, 10 juin 2026

Anthropic élargit l'accès au grand public pour sa classe Mythos en calant des garde-fous sur les requêtes sensibles ; le même jour, Microsoft bloque plus de 70 dépôts GitHub compromis par la campagne Miasma, qui vise la chaîne logistique des credentials des outils génératifs. Entre la bride posée sur le modèle et la clé volée qui ouvre la porte, le 10 juin mesure l'écart entre la capacité déclarée et la garantie établie.

Le Monde (9 juin 2026), dans Intelligence artificielle : Anthropic sort une version bridée de son modèle Mythos, adaptée au grand public, annonce que la start-up a calé des garde-fous sur les requêtes en cybersécurité pour ouvrir son modèle le plus avancé à un public élargi — une reconnaissance que la puissance brute nécessite une bride. Même jour sur arXiv, Flaws in the LLM Automation Narrative EN PREPRINT examine les fondations de ces claims de puissance et soutient que les benchmarks standard mesurent principalement du contenu déjà présent dans les données d'entraînement, sans évaluer la fiabilité ni la variance des réponses ; What Fits (Into Few Tokens) Doesn't Overfit EN PREPRINT propose une explication à cette résilience apparente : les stratégies ML qui réussissent sont hautement compressibles, ce qui limite l'overfitting adaptatif sur benchmarks, une hypothèse testable directement sur des agents de recherche pilotés par LLM. Ce qui relie ces deux travaux, c'est que la mesure de la capacité n'éprouve pas la fiabilité — l'évaluation est biaisée dès la conception.

Do Transformers Actually Help Intrusion Detection? EN PREPRINT réformule CIC-IDS2017 avec de vraies séquences sans fuite de données et conclut que les gains rapportés des architectures temporelles tiennent davantage au protocole expérimental qu'à une réelle capacité de modélisation séquentielle. Generative Explainability for Next-Generation Networks EN PREPRINT s'attaque au même domaine réseau mais par l'explicabilité : un LLM de taille modérée traduit les interactions de features techniques en insights actionnables pour les opérateurs, comblant le fossé entre modèle et humain. Le gain rapporté tient au protocole, pas à la capacité — même motif, mais sur le terrain réseau.

Sur le fine-tuning, A Unifying Lens on Supervised Fine-Tuning Through Target Distribution Design EN PREPRINT traite le SFT comme un design de distribution cible token-level plutôt que comme un simple ajustement one-hot, préservant ainsi le prior du modèle préentraîné face aux démonstrations bruitées. ReasonAlloc EN PREPRINT répartit hiérarchiquement le budget cache KV selon les besoins contextuels stepwise des modèles de raisonnement, évitant l'éviction uniforme qui gaspille la mémoire d'attention.

Inria annonce deux projets concrets : AIKO (9 juin 2026), dédié au traitement automatique de la littérature scientifique en partenariat avec le CIRAD pour accélérer la synthèse bibliographique, et une avancée en modélisation mathématique de l'élastographie (9 juin 2026) pour observer le cœur et la cornée — deux terrains où la modélisation exacte précède et encadre l'usage du ML.

L'axe régulation est silencieux pour le quatrième jour consécutif cette semaine : aucune source relevant du droit, de la norme ou de la gouvernance de l'intelligence artificielle n'a émergé dans le flux du 10 juin 2026.

Numerama (9 juin 2026), dans Claude Fable 5 : Anthropic libère sa première IA de niveau Mythos, et évoque un modèle mystérieux, décrit l'ouverture au grand public de la classe Mythos avec des garde-fous massifs et l'existence d'un jumeau réservé — une segmentation du risque par niveau d'accès. Latent.Space (10 juin 2026), dans [AINews] Anthropic Claude Fable 5 — Mythos but Safe, with Controversial Terms EN, note que ce lancement attendu a été entaché par des conditions d'utilisation contestées, ce qui place le contrat technique au même niveau de débat que l'ingénierie. Placer le contrat au même niveau de débat que l'ingénierie, c'est un choix de société, pas seulement de technique.

Next (9 juin 2026), dans Des outils Microsoft piratés pour voler des identifiants d'outils IA comme Claude Code, rapporte que Microsoft a bloqué plus de 70 dépôts GitHub compromis par la campagne Miasma, ciblant la chaîne logistique des credentials des outils génératifs — la supply chain des agents commence par la compromission de leurs clés d'accès. La chaîne de confiance passe par les credentials.

Numerama (9 juin 2026), dans C'est fait, les arnaques au livreur franchissent une étape que vous n'avez jamais vue… ou entendue, documente une campagne de phishing française employant une note vocale synthétique réaliste de quinze secondes, un pas de plus dans l'usage opérationnel de la voix générée comme vecteur d'attaque. La voix générée devient vecteur d'attaque : l'identité sonore vérifiable n'est pas une garantie établie.

À la marge du secteur, Numerama (9 juin 2026) signale aussi AI1 : SpaceX dévoile les spécificités de son tout premier satellite taillé pour l'IA, un projet de déport du calcul dans l'espace pour contourner la crise énergétique des data centers terrestres — la matière première électrique devient contrainte structurante.

Hugging Face (9 juin 2026), dans Can Voice Agents Handle Bilingual Customers? Benchmarking Frontier ASR on Code-Switched Speech EN, publie un benchmark sur la parole alternée langue à langue et montre que les agents vocaux frontière peinent encore à suivre le code-switching — l'agentivité sonore reste conditionnée par des corpus monolingues. Hugging Face (9 juin 2026), dans How an Agent Built a 3D Paris Gallery by Chaining Two Hugging Face Spaces EN, présente un agent qui construit une galerie tridimensionnelle en chaînant deux Spaces — une démonstration de composition d'outils sans code humain intermédiaire. Sur arXiv, EEVEE: Towards Test-time Prompt Learning in the Real World for Self-Improving Agents EN PREPRINT introduit un routeur multi-dataset pour adapter les prompts à la volée sur des flux de tâches hétérogènes, une forme d'adaptation réactive qui ne suppose pas de frontière de domaine fixe. Chacun de ces trois travaux ouvre une capacité ; aucun ne mesure la fiabilité qui l'accompagne.

Ce billet a été rédigé avec l'assistance d'un système d'intelligence artificielle. Les sources citées sont vérifiables ; la voix éditoriale relève du Département des Harnais.