大型语言模型在2024年Advent of Code竞赛中的表现

2024-12-30
大型语言模型在2024年Advent of Code竞赛中的表现

博主测试了多个大型语言模型(LLM)在2024年Advent of Code编程挑战赛中的表现,结果令人意外:LLM的表现不如预期,甚至不如博主本人。博主使用了简洁的框架,向LLM提供完整的题目描述,要求其生成可执行的Python代码。结果显示,LLM经常出现超时或异常错误,这表明LLM擅长解决已见过的问题,但在处理从未见过的问题时能力有限。这可能与LLM依赖于程序模板有关,也与计算资源和提示工程有关。此次实验也提示,Advent of Code这类竞赛可以作为评估编码智能体的良好基准。

阅读更多
AI

ControlNet 生命游戏

2024-06-20
ControlNet 生命游戏

本文介绍如何使用 ControlNet 来制作生命游戏的动画。ControlNet 是一种稳定的扩散模型,允许通过控制图像来保持生成图像的一致性。作者使用 ControlNet 将每个生命游戏状态的网格图像作为控制图像,并使用不同的图像作为源图像,最终生成了一系列有趣的动画。

阅读更多
未分类 ControlNet