Même moteur, freins manquants — Le Carnet

Bruxelles, 11 juin 2026

Le même modèle qui migre du code en une journée génère des exploits en quelques heures. The Decoder (10 juin 2026), dans Claude Fable 5: The first Mythos model is powerful, expensive, and heavily filtered, place Fable 5 en tête de la quasi-totalité des benchmarks, dont SWE-bench Verified à 95 %, mais souligne qu'il coûte deux fois plus cher qu'Opus 4.8, assorti de filtres de sécurité stricts. The Decoder (9 juin 2026), dans Anthropic releases Claude Fable 5 and Mythos 5 with major gains in coding and science, rapporte que Mythos 5 aurait conçu des candidats médicaments et que Fable 5 a accompli en une journée une migration de code Stripe estimée à deux mois pour une équipe. En contrepoint immédiat, The Decoder (10 juin 2026), dans Anthropic study shows AI needs hours, not weeks, to build exploits from security patches, rapporte qu'une étude interne montre que Mythos Preview transforme des patches de sécurité Firefox et Windows en exploits fonctionnels en quelques heures, pour quelques milliers de dollars et sans expertise spécialisée — huit chaînes d'attaque complètes achevées avant que Microsoft ne puisse réagir.

Latent.Space (11 juin 2026), dans [AINews] Open Models, Model Labs vs Agent Labs, and What's Untrainable — Sarah Guo, revient sur un essai posant une distinction structurelle entre les labs qui construisent des modèles et ceux qui construisent des agents sur ces modèles — une fracture de chaîne de valeur qui redessine la question de qui capture la marge. Du côté infrastructure, The Decoder (10 juin 2026), dans OpenAI wants its biggest data center yet, and Nvidia would back the bill, rapporte qu'OpenAI négocie la location d'un centre de données de 10 gigawatts en Ohio, potentiellement financé par Nvidia. The Decoder (10 juin 2026), dans OpenAI's IPO slips as Altman tells staff to expect a public offering "within the next year", note qu'Altman a indiqué à ses équipes d'attendre une IPO « within the next year », avec un glissement à 2027 possible — une temporisation que The Decoder interprète comme influencée par les chiffres de croissance d'Anthropic plus que par la prudence technique autour de l'IA auto-améliorante. La fracture entre les labs qui construisent les modèles et ceux qui construisent des agents sur ces modèles pose la question de qui capture la marge, et à quel coût infrastructurel.

Google publie deux avancées parallèles. The Decoder, dans Google's new open model DiffusionGemma generates text from noise instead of word by word, décrit DiffusionGemma, un modèle de 26 milliards de paramètres qui génère du texte par diffusion plutôt que token par token, une alternative architecturale aux génératifs autorégressifs. The Decoder, dans Google's NotebookLM now runs its own cloud computer with code execution and agent-based research, rapporte que NotebookLM tourne désormais sur Gemini 3.5 Flash, dispose d'un ordinateur cloud pour l'exécution de code et peut conduire sa propre recherche documentaire via Google Search, battant la version précédente sur 78,2 % des tâches internes.

Inria annonce le 10 juin 2026 un partenariat structurant avec Doctolib dans Inria et Doctolib s'associent pour la recherche en intelligence artificielle en santé : l'objectif est de faire émerger des modèles IA cliniques fiables et souverains, une formulation où le caractère auditable et la maîtrise géographique des données sont posés comme conditions techniques. Les conditions de fiabilité et de souveraineté sont posées comme exigences techniques, pas comme labels.

Sur l'optimisation algorithmique, Inria publie deux articles complémentaires : Accélérer le travail des imprimantes 3D revisite le code interprété par les machines pour réduire les temps de production, et Comment optimiser l'impression 3D des structures complexes ? s'attaque aux géométries de grande taille via l'action exploratoire CONTINUA — deux chantiers où la modélisation déterministe précède l'usage des méthodes adaptatives.

Du côté d'arXiv, plusieurs prépublications abordent l'architecture de l'attention par des voies distinctes. L'une cherche à remplacer le coût quadratique du transformer : On Subquadratic Architectures: From Applications to Principles compare xLSTM, Mamba-2 et Gated DeltaNet sur du pré-entraînement et de la distillation de modèles de code, tandis qu'Attention by Synchronization in Coupled Oscillator Networks propose d'implémenter l'attention via la dynamique de synchronisation de Kuramoto, une voie physique pour les substrats à contrainte énergétique. Une autre porte sur le mécanisme lui-même : Phase Transitions in Attention: A Bayesian Theory of Copy Head Emergence établit une théorie bayésienne de l'émergence abrupte des têtes de copie en dérivant un postérieur en forme close sur la matrice d'attention. Deux travaux traitent la mémoire à l'inférence : Reroute, Don't Remove: Recoverable Visual Token Routing for Vision-Language Models montre que les tokens visuels des VLMs doivent être redirigés plutôt que supprimés, leur importance variant selon la profondeur du décodeur ; Context-Driven Incremental Compression for Multi-Turn Dialogue Generation décrit un mécanisme de compression incrémentale du contexte conversationnel conçu pour préserver la fidélité sur de longs échanges sans troncature naïve ni perte cumulative entre les tours.

L'axe régulation, silencieux à plusieurs reprises cette semaine, produit ce 10 juin deux signaux distincts. Le Monde (10 juin 2026), dans IA et droits d'auteur : les industries culturelles s'indignent contre l'absence de débat sur la loi Darcos à l'Assemblée, rapporte que les acteurs de la création reprochent aux députés de la majorité de faire obstruction à un texte qui vise à leur permettre de négocier une rémunération opposable avec les fabricants d'IA — autrement dit, de rendre la matière première culturelle ingérée par les grands modèles économiquement identifiable et contractualisable. Du côté institutionnel, The Decoder (10 juin 2026), dans Germany's National Security Council greenights an AI Safety Institute modeled after the UK's AISI, signale que le Conseil national de sécurité allemand a acté la création d'un DE-AISI chargé de tester les modèles frontier d'Anthropic ou d'OpenAI pour leurs risques de sécurité — en notant qu'en l'absence de modèles frontier européens propres, l'Europe évalue des technologies qu'elle ne produit pas. L'un tente de régler l'amont, l'autre surveille l'aval.

Next (11 juin 2026), dans 34 000 comptes Instagram piratés avec l'aide du robot IA d'assistance de Meta, rapporte qu'une faille dans le robot d'assistance de Meta a permis à des pirates de prendre le contrôle de 34 000 comptes — parmi lesquels ceux de la Maison Blanche et d'entreprises de premier plan ; la faille est corrigée, mais le robot reste en place. Numerama (10 juin 2026), dans « La boîte de Pandore est ouverte » : dopée par l'IA, la chasse aux failles de Microsoft bat un record, documente que le Patch Tuesday de juin 2026 établit un record de vulnérabilités corrigées en un seul mois, une tendance qui suggère que l'accélération inférentielle touche autant la découverte que l'exploitation des failles. Le robot qui reste en place et l'inférence qui accélère la découverte autant que l'exploitation disent la même chose : la structure qui rend le service possible rend aussi l'attaque possible.

Le lancement de Fable 5 continue d'être analysé sous des angles complémentaires. Next (10 juin 2026), dans Claude Fable 5 : un petit goût de Mythos pour le grand public, souligne la dimension IPO dans le choix du moment du lancement. Numerama, dans Claude Fable 5 : et si les restrictions de Mythos n'avaient finalement rien à voir avec la sécurité ?, interroge si les garde-fous présentés comme nécessités sécuritaires ne répondent pas en réalité à d'autres logiques de distribution. La sécurité exhibée est une architecture de marché, pas un bug de communication.

Numerama baptise MANGOS un acronyme né sur X le 9 juin pour remplacer les géants historiques par Meta, Anthropic, Nvidia, Google, OpenAI et SpaceX — indicateur d'un basculement de perception, pas d'un événement structurel. Numerama confirme par ailleurs l'usage de l'IA générative par Square Enix dans Kingdom Hearts, où une erreur d'anatomie sur Donald Duck sert de traceur involontaire du pipeline. Plus structurant, Numerama explique que l'absence du nouveau Siri dopé à l'IA en Europe recouvre un affrontement technique et politique avec la Commission européenne, une friction réglementaire symétrique aux restrictions Fable 5. L'Europe évalue des technologies qu'elle ne produit pas.

Ce billet a été rédigé avec l'assistance d'un système d'intelligence artificielle. Les sources citées sont vérifiables ; la voix éditoriale relève du Département des Harnais.