Claude Code:AI 辅助交互式定理证明的意外突破

2025-09-20

Anthropic 的 Claude Code AI 编码代理在交互式定理证明 (ITP) 方面表现出色,令人意外。ITP 工具如 Lean 虽然强大可靠,但使用起来耗时且易错。Claude Code 能独立完成许多复杂的证明步骤,虽然仍需人工指导,但它预示着未来 ITP 工具将不再需要专家,更多人能够使用。文章详细探讨了 Claude Code 的能力和局限性,作者利用它对一篇旧论文进行了形式化,尽管速度不如手工完成,但它展现了 AI 在形式化方法领域的巨大潜力,为未来 ITP 的普及带来了希望。

阅读更多

形式化方法项目的成本效益分析

2025-06-02

本文作者结合自身经验,探讨了形式化方法(FM)项目在实际应用中遇到的挑战。作者认为,FM项目成功的关键在于成本效益的平衡。许多潜在的FM项目由于成本过高、效益难以量化或短期内无法体现而难以落地。文章指出,成功的FM项目需要尽早交付价值,将复杂的技术结果转化为客户易于理解的语言,并优先考虑低成本的可靠性保障措施,例如测试和代码审查。作者强调,FM并非万能的,应与其他方法相结合,才能更好地提升软件的可靠性和安全性。

阅读更多
开发

GREASE:一款用于二进制代码漏洞分析的开源工具

2025-03-20

GREASE是一款开源工具,利用欠约束符号执行技术帮助软件逆向工程师分析二进制文件并发现难以察觉的漏洞,从而增强系统安全性。它支持多种架构和格式的二进制文件分析,并可作为Ghidra的插件、独立命令行工具或Haskell库使用。GREASE 通过在完全符号化的寄存器上运行目标函数,并在出现错误时使用启发式方法来细化符号前提条件,从而迭代地发现bug。虽然存在一些局限性,例如可能出现误报或漏报,但GREASE 在提高软件安全性方面具有重要作用,尤其是在分析仅提供二进制形式的COTS软件时。

阅读更多
开发