Claude Code : Une percée inattendue dans la preuve de théorèmes interactive assistée par IA

2025-09-20

L'agent de codage IA Claude Code d'Anthropic excelle de manière surprenante dans la preuve de théorèmes interactive (ITP). Les outils ITP comme Lean, bien que puissants et fiables, sont longs et sujets aux erreurs. Claude Code peut effectuer de nombreuses étapes de preuve complexes de manière indépendante, bien qu'il ait encore besoin de conseils humains. Cependant, il laisse entrevoir un avenir où les outils ITP ne nécessiteront pas d'experts, les rendant accessibles à un public plus large. L'article explore les capacités et les limites de Claude Code, en détaillant l'expérience de l'auteur lors de la formalisation d'un ancien article à l'aide de celui-ci. Bien que plus lent que le travail manuel, il démontre l'immense potentiel de l'IA dans les méthodes formelles, offrant de l'espoir pour une adoption plus large de l'ITP.

Lire plus

La Réalité Coût-Bénéfice des Projets de Méthodes Formelles

2025-06-02

Cet article, basé sur l'expérience de l'auteur, explore les défis liés à l'application des méthodes formelles (MF) dans les projets réels. L'auteur soutient que le succès des projets MF repose sur un équilibre coût-bénéfice. De nombreux projets MF potentiels ne se concrétisent pas en raison de coûts élevés, de difficultés à quantifier les bénéfices ou de l'impossibilité de démontrer une valeur à court terme. L'article souligne que les projets MF réussis nécessitent une livraison de valeur précoce, la traduction de résultats techniques complexes dans un langage compréhensible pour le client et la priorisation de mesures d'assurance de fiabilité à faible coût, telles que les tests et les revues de code. L'auteur souligne que les MF ne sont pas une solution miracle et doivent être combinées avec d'autres méthodes pour améliorer la fiabilité et la sécurité du logiciel.

Lire plus
Développement analyse coût-bénéfice

GREASE : Outil open-source pour la détection de bugs dans les binaires

2025-03-20

GREASE est un outil open-source qui utilise l'exécution symbolique sous-contrainte pour aider les ingénieurs reverse à trouver des bugs difficiles à détecter dans le code binaire, améliorant ainsi la sécurité du système. Il prend en charge diverses architectures et formats, s'intègre à Ghidra, fonctionne comme un outil en ligne de commande autonome ou une bibliothèque Haskell. GREASE analyse les fonctions en les exécutant avec des registres entièrement symboliques, affinant itérativement les préconditions symboliques à l'aide d'heuristiques lorsque des erreurs se produisent. Bien qu'il présente des limitations, telles que de possibles faux positifs et faux négatifs, GREASE contribue grandement à améliorer la sécurité des logiciels, notamment lors de l'analyse de logiciels COTS disponibles uniquement sous forme binaire.

Lire plus
Développement détection de bugs