以色列初创公司 xpander.ai 推出了 Agent Graph System (AGS),这是一种构建更可靠、高效的多步骤 AI 代理的新方法,它基于 OpenAI 的 GPT-4o 等底层 AI 模型。AGS 使用基于图形的工作流,逐步引导代理进行适当的 API 调用,解决了多步骤 AI 代理在复杂 API 模式或不可预测响应方面遇到的挑战。通过基准测试,xpander.ai 证明 AGS 与其代理接口配合使用,可使 AI 代理在多步骤任务中的成功率达到 98%,而传统方法的成功率仅为 24%。AGS 简化了流程,确保工具以正确的顺序使用,并始终遵循模式。
阅读更多
本文探讨了在 C++ 中使用 Mixins 的一种思路,类似 Rust 的 trait 和 C++ concept,旨在改进代码复用和框架设计。作者提出了一种基于 CRTP(奇异递归模板模式)的 Mixin 实现方案,并以 Clone trait 为例进行了说明。该方案允许在编译时检查类是否实现了特定接口,并能避免虚函数表带来的开销。作者还讨论了如何利用该方案实现类似 Rust 的关联类型和侵入式引用计数。虽然 C++ 标准库中的 concept 已具备类似功能,但作者认为这种方案仍然具有一定的价值,尤其是在早期 C++ 版本中。
阅读更多
本文讲述了如何为LuaJIT实现一个基于BPF的通用零插桩分析器。与之前的工作不同,这次使用了OpenTelemetry eBPF分析器,通过一个小型BPF程序从堆栈中抓取最少的信息,并将其传递给用户态程序进行处理。文章详细解释了LuaJIT的跟踪JIT机制及其优势,以及如何克服跟踪爆炸问题。然后,文章探讨了如何对LuaJIT程序进行性能分析,比较了perf、gdb采样和LuaJIT内置分析器的优缺点,并最终确定使用基于eBPF的零插桩分析器。文章详细介绍了如何识别LuaJIT解释器和JIT帧,如何获取LuaJIT上下文指针,以及如何遍历Lua语言堆栈。最后,文章总结了eBPF程序和用户态程序的工作流程,并展示了实际效果。
阅读更多
lean-smt项目受SMTCoq启发,旨在提供可将Lean目标转换为SMT解算器的策略。该项目目前处于测试阶段,支持未解释函数和线性整数/实数算术(带量词)理论,位向量理论的支持处于实验阶段。lean-smt依赖于lean-cvc5 FFI,目前仅支持Linux (x86_64) 和 macOS (AArch64)。主要策略`smt`将当前目标转换为SMT查询,发送给cvc5,并在解算器返回unsat时在Lean中重放cvc5的证明。
阅读更多
本文作者通过基准测试比较了不同Python版本(包括CPython 2.7、3.8至3.13以及PyPy)与Node.js和Rust的性能。测试用例包括斐波那契数列计算和冒泡排序。结果显示,Python 3.11版本在性能上有了显著提升,PyPy的表现也令人印象深刻,速度接近Node.js。作者还讨论了asyncio、JIT编译器和GIL对Python性能的影响,并提供了测试代码和脚本。最终结论是,Python的性能并非一成不变,开发者需要根据实际情况进行评估。
阅读更多
普林斯顿大学和华盛顿大学的研究人员开发了一种“元光学”相机,其大小与一粒盐相当。这款超紧凑相机系统采用了被称为“超表面”的技术,该技术布满了160万个圆柱形立柱,其生产方式与计算机芯片类似。这款相机是同类产品中首个能够生成与传统相机质量相当的全彩图像的设备,而传统相机的体积要大50万倍。研究人员利用纳米结构的“超表面”和新颖的硬件设计方法,并结合AI图像后处理技术,突破了以往元光学成像设备的局限,实现了高质量成像。这项技术为医疗成像、消费电子产品、无人机和望远镜等领域带来了新的可能性。
阅读更多
本文分析了去中心化社交平台Mastodon的几个主要弱点,并探讨了相应的改进方案。主要问题包括无法引用帖子、无法查看所有回复、跨服务器只能看到部分用户信息、缺乏全局搜索和算法推荐、无法定时发布帖子以及用户身份与服务器绑定等。文章详细介绍了针对这些问题的短期和长期改进措施,例如正在开发的引用帖子功能、获取全部回复的改进、用户资料数据同步、联邦宇宙搜索引擎项目、以及关于用户身份迁移和数据备份的讨论。此外,文章还探讨了服务器的管理、回复控制、以及其他改进方向,例如ActivityPub测试套件和增量备份等。
阅读更多
Fern是一家YC孵化的初创公司,致力于为REST API提供高质量的SDK和文档。该公司位于纽约布鲁克林,目前团队规模不足10人。他们正在招聘一位后端工程师,要求有4年以上后端或全栈开发经验,精通TypeScript和至少另一门编程语言,并有从零开始项目的经验。薪资范围为16.8万至19.2万美元,另有1.8万美元的近办公室居住补贴,以及股票期权、一日三餐和全面的医疗保险。
阅读更多
本文介绍了两个全新研发的德语解码模型LLäMmlein 1B和120M。该项目涵盖了数据预处理、自定义分词器创建以及训练设置优化等关键步骤。通过在SuperGLEBer基准测试中的评估,LLäMmlein模型表现出与同等规模模型相当或更优的性能,其中1B模型甚至能与更大规模的模型相媲美。目前,预印本、基础模型和聊天调优模型均已发布,代码和数据也将很快开源。
阅读更多
这张图像是由欧洲南方天文台甚大望远镜干涉仪(ESO的VLTI)上的GRAVITY仪器拍摄的恒星WOH G64。这是第一张银河系外恒星的特写照片,这颗恒星位于大麦哲伦星云中,距离地球超过16万光年。图像中心明亮的椭圆形是一个包裹着恒星的尘埃茧。周围较暗的椭圆环可能是尘埃环的内缘,但需要更多观测来证实这一特征。
阅读更多
本文分析了谷歌计划将 ChromeOS 与安卓系统合并的原因和意义。 ChromeOS 的局限性在于缺乏原生安卓应用支持和对 x86 架构的依赖,使其在面对苹果的 Arm 芯片和 iPad 的竞争中处于劣势。合并安卓系统可以解决这些问题,并借助 Gemini AI 和谷歌定制芯片,在 Arm 笔记本电脑市场与苹果和微软竞争。文章还探讨了高通与 Arm 的法律纠纷对 Arm 生态系统的影响,以及谷歌自研芯片的进展。作者认为,这次合并对谷歌来说是一个关键时刻,它有机会重新定义其在个人计算领域的愿景,但能否成功还有待观察。
阅读更多
本文探讨了Emacs中一个鲜为人知的特性——代码转换语言(CCL)。CCL是一种字节码解释器,用于文本编码和解码,拥有自己的虚拟机和一套简单的指令集。作者通过示例代码演示了CCL如何进行字符串处理、算术运算等操作,例如字符转换、ROT13加密、阶乘计算等,并与Emacs Lisp的性能进行了比较。作者还尝试用CCL实现图灵完备的系统,例如Rule 110,但最终发现CCL由于I/O限制,无法实现循环输入输出,因此并非图灵完备。文章最后总结了CCL的优缺点,指出其性能提升不稳定、代码难以编写和维护等问题,并对CCL的未来发展表达了担忧。
阅读更多
IBM 在首届量子开发者大会上宣布,其量子计算机已成功实现两年前提出的 100x100 性能挑战,即运行包含 100 个量子比特和 100 个门深度的量子电路。最新版本的 Heron R2 芯片具备 156 个量子比特,并通过硬件、中间件和软件的改进,能够精确运行包含 5000 个双量子比特门的电路,运算速度超过 150,000 CLOPS。此外,IBM 还发布了新的软件工具和 Qiskit 函数库,以帮助开发者更轻松地构建和运行量子算法,并展示了连接多个量子芯片的 Flamingo 和 Crossbill 技术,为未来的量子计算发展奠定了基础。
阅读更多
本文介绍了利用计时攻击发现Web漏洞的新方法,并提供了实际案例。作者通过改进计时攻击技术,使其更加精确和高效,能够在几秒内可靠地检测到亚毫秒级的时间差异。文章重点介绍了三种关键攻击技术:发现隐藏的攻击面、服务器端注入漏洞和错误配置的反向代理。此外,作者还讨论了如何使计时攻击更加实用,包括减少网络和服务器噪声、利用单包攻击等。文章还提供了一个CTF挑战,帮助读者练习新的技能。
阅读更多
Tailwind CSS v4.0 Beta 1 版本发布,该版本带来了全新的引擎,构建速度提升高达 5 倍,增量构建速度提升超过 100 倍。新版本具有统一的工具链,内置导入处理、供应商前缀和语法转换,无需额外的工具。此外,它采用 CSS 优先配置,开发者可以直接在 CSS 中自定义和扩展框架。v4.0 还支持级联层、宽色域颜色以及容器查询、@starting-style、弹出窗口等现代 CSS 功能。
阅读更多
本文介绍了主题地图的概念,它是一种描述知识结构并将其与信息资源相关联的ISO标准。主题地图的核心概念是主题、关联和出现(TAO),以及身份、方面和范围(IFS)。主题代表任何事物,可以具有名称、出现(指向相关信息的链接)和关联(与其他主题的关系)。主题和关联可以分类,出现可以具有角色。主题身份用于标识同一主题,方面用于向信息资源添加元数据,而范围限定了主题特征的有效性。主题地图可以用于各种知识管理应用,例如索引、术语表、语义网络等,并能够跨越多个文档和信息库。
阅读更多
文章探讨了大型语言模型(LLM)在国际象棋中表现的奇怪现象:gpt-3.5-turbo-instruct棋力远超其他LLM。作者通过实验发现,并非OpenAI作弊,而是其他LLM未能充分发挥潜力。通过“强制复述”技巧,即要求模型复述整个棋局后再给出下一步,可以显著提高gpt-4o-mini和gpt-4o的棋力。作者认为,OpenAI的基座模型在国际象棋方面表现优异,但聊天模式限制了其能力。此外,少量示例学习和微调也有助于提高棋力,但提供合法走法列表反而会降低性能。作者推测,OpenAI的基座模型训练数据包含更多高质量的棋局,而开放模型缺乏这方面的数据。
阅读更多
Broadcastarr 是一款服务,允许用户通过网页抓取媒体内容并进行串流播放。它使用 AgendaTS 服务进行任务调度,例如发布类别、索引类别、抓取串流、发布群组等。该服务还包含一个 Discord 机器人,用于处理交互和命令,例如添加类别、设置配置等。Broadcastarr 支持 Jellyfin 作为播放器,以及 Discord 和 Matrix 作为发布平台。它具有可扩展性,并可以通过 Docker 镜像部署。此外,它还包含一个 Wireguard 客户端,允许工作节点通过 VPN 抓取网页内容。
阅读更多
本文探讨了私人书房的兴起,重点介绍了马基雅维利、蒙田和杜波依斯等人在私人书房中与书籍和古代作家进行思想交流的体验。文章描述了马基雅维利在被流放期间,如何在书房中与古代作家对话,从他们的著作中汲取智慧,并将这种阅读体验比作一种与死者交流的仪式。文章还探讨了私人书房作为个人庇护所和自我修炼空间的重要性,以及它如何塑造了现代自由主义的自我意识。
阅读更多
本文介绍了如何使用Liquidsoap构建一个灵活的网络电台。作者对比了传统网络电台工具的局限性,例如固定播放列表和脆弱的本地回环,并提出了Liquidsoap的优势:无缝处理主要播放列表和实时麦克风插入、与更大的电台管理工作流程集成(自动获取和播放Navidrome实例中的播放列表)、以程序方式维护。文章给出了Liquidsoap脚本示例,演示了如何创建流生成器、处理输入输出、实现交叉渐变、添加麦克风输入以及设置回调函数等功能。作者还分享了个人电台的设置,并总结了Liquidsoap带来的好处:降低了直播中断的风险,让电台管理更轻松有趣。
阅读更多
ESET研究人员分析了此前未知的Linux后门程序WolfsBane,该程序与中国APT组织Gelsemium使用的已知Windows恶意软件以及Project Wood有关联。WolfsBane是Gelsevirine的Linux版本,而另一个后门FireWood则与Project Wood相关,但与Gelsemium的关联度较低。这些后门和工具的目标是网络间谍活动,窃取系统信息、用户凭据和特定文件等敏感数据。研究人员认为,APT组织对Linux恶意软件的关注日益增加,这可能是由于Windows电子邮件和终端安全性的改进,迫使攻击者转向利用面向互联网的Linux系统漏洞。
阅读更多
NeuralDEM 提出了一种端到端的方法,用深度学习代理模型替代离散元法 (DEM) 例程和耦合多物理场模拟。它将 DEM 的拉格朗日离散化建模为一个底层连续场,同时将宏观行为直接建模为附加辅助场。NeuralDEM 引入了多分支神经算子,可扩展到工业规模场景的实时建模,从慢速伪稳态到快速瞬态。该模型成功模拟了料斗卸料和流化床反应器等场景,并能准确预测宏观量,如流态、流出速率和颗粒混合行为。
阅读更多
Pidgin 团队宣布将于2024年12月31日发布 Pidgin 3.0.0 的首个实验版本,版本号为2.90.0。该版本为 pre-alpha 版本,仅提供源码和 Flatpak 安装包,功能尚未完善,仅支持 IRCv3 协议,用户界面未经完善,与 Pidgin 2 完全不兼容,现有插件均不适用。团队计划后续发布实验性版本2,并最终实现3.0.0正式版。
阅读更多
本文介绍了WhisperNER,一个可以联合进行语音转录和实体识别的模型。该模型支持开放类型的命名实体识别,能够在推理过程中识别多样且不断变化的实体。研究人员利用合成的语音样本增强了一个大型合成数据集,并用NER标签提示模型,对其进行优化以输出转录的语音以及相应的标记实体。实验结果表明,WhisperNER在域外开放类型命名实体识别和监督微调方面均优于自然基线。
阅读更多
该项目名为“可视化排序之排序之声”,使用Svelte构建,可以将各种排序算法(如冒泡排序、快速排序、归并排序等)以可视化的方式呈现,并配以不同的声音效果(如正弦波、方波、锯齿波等)和主题。用户可以自定义数组大小、延迟时间等参数,并选择不同的排序算法和声音主题进行演示。
阅读更多
1994年11月14日,第一列载客欧洲之星列车从伦敦滑铁卢车站出发,穿过英吉利海峡隧道前往巴黎,标志着英法两国交通的新纪元。车厢内充满了庆祝的氛围,乘客们为这一历史性时刻欢呼雀跃。文章回顾了英吉利海峡隧道的历史,并将其与英国与其邻国的关系联系起来。
阅读更多
为庆祝ChipWits游戏40周年,其原始Mac和Commodore 64版本的FORTH源代码已开源。开发者分享了代码恢复过程,包括使用原始磁盘驱动器和特殊硬件读取老旧磁盘,并将其内容上传至GitHub。文章回顾了ChipWits的历史,解释了选择FORTH作为开发语言的原因,以及移植到Commodore 64和Apple II平台的挑战。同时,文章展示了部分FORTH代码片段,并邀请社区参与代码整理和维护,最终目标是创建一个现代PC可用的社区维护版本。
阅读更多