用玩游戏来测试软件?这家公司用马里奥和银河战士证明了它的可行性

2025-08-24
用玩游戏来测试软件?这家公司用马里奥和银河战士证明了它的可行性

一家公司通过玩任天堂游戏,特别是《银河战士》和《超级马里奥兄弟》,来测试其软件平台Antithesis。起初,他们的AI测试系统在《银河战士》中卡在一个红门前,因为系统优先消灭敌人而消耗了所有导弹。这促使他们开发了一种新的“群体测试”技术,该技术能够在探索状态空间的同时优化目标,例如优先保持更多导弹。这种技术不仅解决了红门问题,还使Antithesis能够以更有效率的方式探索游戏世界,发现游戏中的漏洞,甚至利用游戏机制完成“速通”。这项技术不仅适用于游戏测试,还可以应用于各种软件测试场景,例如寻找内存泄漏或性能异常。

阅读更多
开发

让一切可测试:HashiCorp联合创始人Mitchell的GPU测试难题

2025-07-06
让一切可测试:HashiCorp联合创始人Mitchell的GPU测试难题

HashiCorp联合创始人Mitchell在开发其最新项目Ghostty(一款GPU渲染终端模拟器)时,遇到了一个棘手的难题:如何测试GPU渲染的代码?这篇文章总结了他在BugBash大会上分享的经验,探讨了如何让看似不可测试的代码变得可测试,并指出在AI时代,针对GPU渲染等复杂软件的测试方法仍然是一个有待解决的挑战。Mitchell的解决方案为我们提供了宝贵的经验,也体现了Antithesis公司在不断拓展测试边界上的努力。

阅读更多
开发 GPU测试

疯狂山脉

2024-07-10
疯狂山脉

本文讲述了作者公司为了解决NixOS上构建原生可执行文件和共享库时遇到的glibc版本兼容性问题,开发了一款名为“疯狂山脉”的工具。该工具通过创建一个“元加载器”,动态识别并调用正确的ld-linux.so版本,从而解决了在不同Linux系统上运行NixOS构建的程序时的兼容性问题。

阅读更多
未分类 程序加载器