Webtagr - 科技资讯摘要

Poireau: 一款轻量级堆内存调试器

2025-05-22

Poireau是一个用于调试内存分配问题的轻量级库。它通过采样一小部分malloc/calloc等调用来生成应用程序堆内存使用情况的统计概要，对性能影响极小。Poireau使用Linux perf进行跟踪，并通过一个外部脚本分析结果，定位内存泄漏等问题。其优势在于低侵入性、易于审计和在生产环境中使用，即使在程序崩溃后也能提供信息。

(github.com)

开发内存调试

用图形调试Hilbert曲线：一次充满视觉的编程体验

2025-05-22

作者倡导一种极简编程风格，并使用Lua和LÖVE库进行图形化调试。文章以Hilbert曲线的绘制为例，通过多次迭代，逐步改进可视化方法，最终实现了一个精巧的图形化调试界面，包含文本日志、重放日志、表面绘制和爆炸图等功能，使得原本复杂的递归算法变得清晰易懂。作者还总结了几个通用的图形化调试UI模式，为以后的调试工作提供了宝贵的经验。

(akkartik.name)

开发图形化调试

在使用Pydantic处理大型JSON文件时，内存消耗过高是一个常见问题。文章分析了Pydantic默认JSON加载的高内存占用原因，并提出了两种解决方案：一是使用ijson库进行增量式JSON解析，降低解析过程中的内存占用；二是将Pydantic模型转换为使用`slots`的dataclass，减少对象内存消耗。实验结果表明，结合这两种方法，可以将内存占用降低至原来的1/4，有效解决了大型JSON文件处理的内存瓶颈。

(pythonspeed.com)

开发

超越排序：深度学习赋能的次序无关透明度渲染

2025-05-22

传统的透明物体渲染技术依赖于深度排序，但在复杂场景中容易出现瑕疵。这篇Eurographics 2025论文探讨了次序无关透明度(OIT)技术，它无需深度排序即可准确渲染透明物体。论文涵盖了传统OIT方法（精确、近似和混合方法）以及深度学习方法，并分析了它们的范围、性能和准确性，为游戏、模拟和电影特效等领域带来更逼真的透明效果。

(www.tobias-franke.eu)

开发透明度渲染

你的授权系统即将爆炸？五个迹象告诉你

2025-05-22

本文列举了五个迹象，表明你的应用授权系统可能存在问题，例如：权限系统仅仅是一个字典；更新角色权限需要修改许多地方；无法清晰地回答“管理员能做什么”；未来需要自定义角色和权限；计划将单体应用拆分为微服务。文章建议使用声明式授权模型，将授权逻辑集中到一个服务中，并选择一个为可扩展性和分布式系统设计的授权平台，例如Oso，来解决这些问题。

(www.osohq.com)

开发

形式化方法中误导性基准测试的批判

2025-05-22

一篇论文利用形式化方法验证操作系统代码时使用了误导性的统计数据。作者批判了单纯比较“证明代码比”的错误方法，因为它忽略了规范的完整性和复杂性。文章指出，证明大小与规范大小之间存在近似二次关系，而规范的复杂性远比代码大小更重要。通过对多个已验证系统的分析，作者展示了更全面的数据，包括代码大小、规范大小和证明大小，并强调了模块化在降低验证成本方面的作用，但同时也指出像seL4这样复杂的系统难以模块化。最终，作者呼吁研究界停止使用毫无意义的“证明代码比”指标。

(microkerneldude.org)

开发

DockFlow: 一键切换 macOS Dock 布局，告别多任务切换的烦恼

2025-05-22

开发人员日常使用多个应用程序，经常需要在不同的应用场景之间切换，导致效率低下。DockFlow 应运而生，它是一款 macOS 生产力应用，只需一键即可切换预设的 Dock 布局，例如设计、编码、写作或会议模式。告别繁琐的图标拖动和应用查找，DockFlow 帮助你快速进入工作状态，提升效率，专注于当前任务。

(dockflow.appitstudio.com)

开发

Godot引擎下的Winamp 2.9复刻版：怀旧与现代的完美融合

2025-05-22

一位开发者利用Godot引擎复刻了经典音乐播放器Winamp 2.9，并实现了全平台兼容。这个项目最初是为了参加Tool Jam 5比赛，如今已发展成为一个可定制的音乐播放器，它保留了老式互联网的风格，同时利用现代工具构建，可在任何平台上运行。该项目包含播放、暂停、停止、上一曲/下一曲等基本功能，以及播放列表功能、均衡器、波形可视化等高级功能。开发者声明这是一个免费的非商业项目，所有版权归原作者所有。

(github.com)

开发

Python 包安装失败分析：aiohttp, cryptography, grpcio 和 s3fs

2025-05-22

一次 Python 包安装过程中，aiohttp, cryptography, grpcio 和 s3fs 四个包安装失败。aiohttp 失败原因是编译过程中出现未知类型名 '__pyx_vectorcallfunc' 的错误，可能与编译器版本或 Cython 版本不兼容有关。cryptography 失败是因为依赖的 asn1 包要求 rustc 1.65.0 或更高版本，而当前版本为 1.63.0。grpcio 失败原因是 C++ 编译器出错，导致无法编译扩展。s3fs 的失败信息与 aiohttp 相同，也与编译器或 Cython 版本兼容性问题有关。其他包例如 boto3, requests 等安装成功。

(ft-checker.com)

开发编译错误

iMessage 集成日程规划应用 Whenish：告别无尽的短信往返

2025-05-22

Whenish 是一款直接集成在 iMessage 中的日程规划应用，旨在简化约会安排流程。用户只需在群聊中点击 Whenish 图标，选择可用的日期，发送投票，即可实时查看大家的回复，无需切换应用，告别繁琐的短信沟通。它适用于各种类型的聚会，例如家庭聚餐、周末旅行或工作会议等。

(apps.apple.com)

开发日程规划效率应用

开发者怒怼苹果：自己动手丰衣足食，打造本地化音乐播放器

2025-05-22

因为不满苹果音乐服务的限制和订阅模式，一位开发者从零开始构建了自己的iOS音乐播放器。该播放器支持本地文件播放、iCloud同步和全文搜索等功能，并巧妙地利用SQLite的FTS5特性实现了高效的模糊搜索。开发过程中，他从React Native转向SwiftUI，并采用类似后端架构的模式，有效地管理数据流和并发性。虽然最终成功构建了理想的音乐播放器，但他也指出苹果在开发者工具和应用分发方面的限制，认为这阻碍了个人应用开发的便捷性，与AI时代软件开发的简易性形成鲜明对比。

(nexo.sh)

开发

Ruby 3.5 对象分配速度提升六倍：内联 Class#new 的秘密

2025-05-22

Ruby 3.5 通过内联 Class#new 方法显著提升了对象分配速度，最高可达 6 倍。文章深入探讨了这项优化的细节，包括基准测试结果、性能瓶颈分析以及内联技术的实现原理。通过避免方法调用开销，减少参数复制，并提升内联缓存命中率，这项优化有效解决了 Ruby 对象分配的性能问题，但同时也带来了一些细微的向后兼容性问题。

(railsatscale.com)

开发

重拾Bug Council：修复GitHub Issues的不足

2025-05-22

作者回顾了在硅谷早期使用BugSplat进行项目管理的经验，它遵循四个关键原则：所有任务均作为bug记录，bug记录拥有统一且详尽的模式，每个bug只分配给一人负责，以及灵活的查询功能。作者发现现今的GitHub Issues等系统远不如BugSplat高效，因为它缺乏完善的模式，责任分配模糊，查询功能有限。文章最后介绍了作者团队如何通过改进开源项目Gitea来弥补这些不足，最终实现按优先级排序bug列表的功能。

(www.bozemanpass.com)

开发 GitHub Issues

用MCP协议让AI学会解微积分：一个危险但有趣的实验

2025-05-22

作者尝试使用Anthropic的Model Context Protocol (MCP) 协议，将语言模型与符号代数系统（如SymPy）结合，解决语言模型在处理复杂数学问题上的弱点。MCP允许语言模型调用外部工具，作者通过MCP将复杂的微积分问题分解成多个步骤，最终成功地利用SymPy求解了阻尼谐振子方程。尽管MCP生态系统尚不成熟，存在安全隐患，但该方法展示了将语言模型与专业工具结合的巨大潜力，为自然语言接口与形式化数学的结合提供了可能性。

(www.stephendiehl.com)

开发

SQLite-JS: 用 JavaScript 扩展 SQLite 的强大功能

2025-05-22

SQLite-JS 扩展允许你使用 JavaScript 代码创建自定义 SQLite 函数、聚合函数、窗口函数和排序规则，直接在 SQLite 数据库中实现灵活强大的数据操作。它支持多种函数类型，包括标量函数（处理单行数据）、聚合函数（处理多行数据）、窗口函数（访问完整数据集）和排序规则（自定义文本排序）。通过简单的 SQL 语句，你可以创建自定义函数来执行各种计算、文本处理和数据转换。例如，你可以创建函数计算年龄、计算中位数、计算移动平均值，甚至自定义排序规则。此外，SQLite-JS 还允许直接执行 JavaScript 代码，进行更复杂的计算或数据处理。值得一提的是，配合 sqlite-sync 使用，自定义函数还能自动同步到 SQLite Cloud 集群。

(github.com)

开发

Forge：基于AWS的GitHub Actions多租户运行器平台

2025-05-22

Forge是一个可扩展、安全且完全自动化的多租户平台，用于在AWS上运行短暂的GitHub Actions运行器。它由平台工程师为平台团队设计，旨在简化GitHub Actions的部署和管理。Forge自动化了短暂GitHub Actions运行器的供应和生命周期管理，支持EC2和EKS，并提供多租户隔离、漂移修复和原生可观察性等功能。它支持多种操作系统、GitHub Cloud和GHES，并具有成本感知调度、灵活的基础设施和多运行器部署等优势。用户可通过逐步指南快速上手，并根据自身需求调整各项配置。

(github.com)

开发

基于three.js的4D旋转曲面空间着色器

2025-05-22

一个基于three.js的GLSL着色器，通过4D旋转和立体投影，将3D模型投射到4D单位球面上，从而模拟曲面空间效果。该着色器最初使用HLSL编写，用于Unity游戏Sfera。用户可通过鼠标和键盘控制缩放、旋转和视角，体验动画模型在曲面空间中的运动。项目包含在线演示和视频教程，模型文件从three.js库加载。

(github.com)

开发 4D图形

Rust AV1解码器性能优化：避免不必要的内存清零和优化结构体比较

2025-05-22

作者通过比较Rust编写的AV1解码器rav1d和C编写的dav1d的性能，利用采样分析器找到了两个性能瓶颈。第一个是rav1d在Arm架构下不必要地清零了一个缓冲区，导致性能下降。第二个是rav1d中结构体比较的低效实现。通过使用`MaybeUninit`避免不必要的内存清零和优化结构体比较，作者将rav1d的性能提升了近2%。

(ohadravid.github.io)

开发

OpenAI 的 o3 模型发现 Linux 内核零日漏洞

2025-05-22

本文描述了作者如何利用 OpenAI 的 o3 模型在 Linux 内核中发现一个零日漏洞（CVE-2025-37899）。作者在对 ksmbd 进行漏洞审计时，使用 o3 模型分析代码，成功发现了 ksmbd 中 SMB ‘logoff’ 命令处理程序中的一个 use-after-free 漏洞。o3 模型能够理解并发连接和对象共享的复杂逻辑，从而识别出该漏洞。此外，o3 模型还重新发现了另一个漏洞 CVE-2025-37778。作者认为，o3 模型在代码推理能力方面取得了显著进步，为漏洞研究人员提供了新的工具，可以显著提高效率。

(sean.heelan.io)

开发

代码OCR：让截图变代码

2025-05-22

Pieces公司优化了OCR技术，使其能够准确识别代码截图。他们基于Tesseract引擎，并添加了预处理和后处理步骤，以应对不同编程环境（亮/暗模式）、背景噪声和低分辨率图像等挑战。通过图像预处理（包括暗模式图像反转、噪声去除和分辨率提升），以及后处理（代码缩进恢复），最终提高了代码识别精度。他们使用Levenshtein距离评估模型性能，并通过实验选择了高效的图像上采样方法。这项技术让开发者可以轻松将代码截图转换为可编辑的代码，提高了开发效率。

(pieces.app)

开发代码识别

从14人团队到高效协作：一个关于专业化与通才化的故事

2025-05-22

一个14人开发团队因沟通不畅和效率低下而苦苦挣扎。他们尝试了各种方法，包括异步站会和拆分团队，但都未能解决根本问题。最终，他们决定摒弃专业化分工，转向通才模式，让团队成员掌握多种技能，共同负责产品的各个方面。这一转变带来了意想不到的积极效果：团队协作更加顺畅，效率显著提高，交付速度加快，产品质量提升，人员利用率也得到优化。然而，通才模式也带来了一些挑战，例如部分成员的离职和工作强度增加。作者认为，没有放之四海而皆准的最佳实践，适合自己团队的才是最好的，持续改进和不断实验才是关键。

(blog.alexewerlof.com)

开发通才

Java 紧凑对象头正式成为产品特性

2025-05-22

Java增强提案(JEP) 519正式将实验性特性“紧凑对象头”升级为产品特性。此特性在JDK 24中首次引入，旨在优化对象头布局，提升性能。经过在Oracle和Amazon的大规模测试验证，其稳定性和性能提升得到充分证明，因此不再需要`-XX:+UnlockExperimentalVMOptions`选项启用。未来，如果需要更多对象头位，项目Valhalla和Lilliput已预留空间和技术方案。

(openjdk.org)

开发

Hotspot：Linux性能分析的GUI利器

2025-05-22

KDAB研发了一款名为Hotspot的Linux性能分析GUI工具，它以用户友好的界面呈现Linux perf数据。Hotspot支持多种性能数据格式，并提供图形化视图、时间线过滤、perf启动器等功能。它支持AppImage、AUR、Debian、Ubuntu、Fedora等多种安装方式，用户也可以从源码构建。Hotspot还支持离CPU分析，通过记录内核跟踪点来识别线程等待的原因。此外，它允许导出自包含的性能数据，方便共享和分析。虽然Hotspot目前功能尚不完善，但它为Linux性能分析提供了更便捷的途径。

(github.com)

开发

Dijkstra眼中的Ada语言提案：一场技术与混乱的较量

2025-05-22

图灵奖得主Dijkstra曾对Ada语言的四个候选提案（红、绿、蓝、黄）进行评审。他对“红”提案评价为“先进和落后并存，令人困惑”；对“绿”提案则毫不留情地批评其“技术上的无能，可能还伴有欺骗行为”；“蓝”提案在他看来“复杂到无法接受”，文档更是“技术文档和推销话术的混合体”；而对于最终胜出的“绿”提案，他甚至担心西方安全依赖于它，调侃说“如果让苏联红军来用它，我反而会更安心”。这段历史，展现了软件工程中对技术严谨性和清晰设计理念的极致追求，也体现了Dijkstra对软件质量的挑剔和高标准。

(craftofcoding.wordpress.com)

开发 Ada语言 Dijkstra

Debian软件包变更原因详解

2025-05-22

一年半前，我写了《为什么Debian是这样的？》，之后很多人问我为什么Debian会更改其软件包。这篇文章简要列举了一些原因：遵循Debian政策手册中规定的政策（例如系统配置位置、文档位置等）；确保程序间的兼容性（例如Unix域套接字位置、运行用户账户）；移除“联网汇报”或绕过Debian打包系统更新软件的代码（出于隐私和安全考虑）；修复或回溯修复bug，改善用户体验；避免包含无法合法分发的代码（根据Debian自由软件指南）；添加缺失的手册页。总之，Debian的软件包变更旨在确保系统稳定性、安全性及自由软件原则的遵守。

(blog.liw.fi)

开发

Inigo Quilez的计算机图形学教程宝库

2025-05-22

Inigo Quilez是一位资深的计算机图形学专家，自1994年以来一直致力于学习和分享他的知识。他的网站提供大量的计算机图形学教程，涵盖了从SDF和光线追踪到分形和数学技巧等众多主题。教程以简洁明了的代码片段和清晰的解释为特点，适合不同水平的学习者。此外，他还提供了视频教程和其它资源，并开放了代码的MIT许可，方便大家学习和应用。

(iquilezles.org)

开发 SDF

DuckDB在2012款MacBook Pro上的惊人表现：我们是否在分布式架构上浪费了十年？

2025-05-22

本文通过在2012款MacBook Pro上运行DuckDB数据库并进行TPC-H基准测试，探讨了单机数据库性能的提升速度是否超过了数据规模的增长速度。结果显示，这款十年前的笔记本电脑可以完成复杂的分析型SQL查询，虽然速度比现代MacBook慢得多，但完成时间仍在可接受范围内。这引发了作者对过去十年中过度追求分布式数据分析架构的反思，认为单机数据库技术在当时已经具备处理大型数据集的能力，分布式架构的兴起可能并非完全必要。

(duckdb.org)

开发

Kotlin语言服务器：尚在实验阶段的VS Code扩展

2025-05-22

Kotlin语言服务器为Visual Studio Code带来了官方的Kotlin支持（目前为预发布Alpha版本）。该服务器基于IntelliJ IDEA和其Kotlin插件构建，支持大多数核心功能，但仍处于实验阶段，稳定性无法保证。目前仅支持JVM-only Kotlin Gradle项目，且部分代码闭源，未来计划完全开源。虽然可以直接在VS Code上安装使用，但其他编辑器的配置需要手动完成。开发者鼓励用户尝试并反馈意见，但暂不支持直接贡献代码。

(github.com)

开发

一篇论文从拒稿到接收的蜕变：页面一的重要性

2025-05-22

一篇论文在投稿后被拒稿，作者通过对论文第一页（标题、摘要、图一和引言）的精心修改，以及补充基线、消融实验和统计显著性等内容，成功使其被接收。文章详细阐述了修改过程，强调第一页的重要性，以及如何通过清晰的图表、具体的标题和摘要、以及精心设计的引言来吸引读者。作者还分享了改进图表和结论的技巧，以及如何通过添加基线和消融实验来避免拒稿。最终，作者认为，清晰的沟通是提升科学研究影响力的关键。

(maxwellforbes.com)

开发科研技巧

用大型语言模型和MCP服务器查找邮件中的信息

2025-05-22

作者构建了一个MCP服务器，允许大型语言模型 (LLM) 只读访问其电子邮件。通过与Gemini（一种LLM）的对话，作者演示了如何利用简单的搜索和检索工具，在邮件中找到Donovan儿子的名字。尽管Gemini最初的搜索策略使用了多个关键词（如“son”、“boy”、“baby”），但大部分都指向了Donovan的亲戚。最终，Gemini通过分析邮件主题和内容，从初始搜索结果中发现了线索，成功找到了儿子的名字Monty。这个过程展现了LLM结合特定工具进行信息检索的能力，也突出了精准搜索策略的重要性。

(blog.nawaz.org)

开发

分类: 开发

Poireau: 一款轻量级堆内存调试器

用图形调试Hilbert曲线：一次充满视觉的编程体验

Pydantic处理大型JSON文件的高内存消耗问题

超越排序：深度学习赋能的次序无关透明度渲染

你的授权系统即将爆炸？五个迹象告诉你

形式化方法中误导性基准测试的批判

DockFlow: 一键切换 macOS Dock 布局，告别多任务切换的烦恼

Godot引擎下的Winamp 2.9复刻版：怀旧与现代的完美融合

Python 包安装失败分析：aiohttp, cryptography, grpcio 和 s3fs

iMessage 集成日程规划应用 Whenish：告别无尽的短信往返

开发者怒怼苹果：自己动手丰衣足食，打造本地化音乐播放器

Ruby 3.5 对象分配速度提升六倍：内联 Class#new 的秘密

重拾Bug Council：修复GitHub Issues的不足

用MCP协议让AI学会解微积分：一个危险但有趣的实验

SQLite-JS: 用 JavaScript 扩展 SQLite 的强大功能

Forge：基于AWS的GitHub Actions多租户运行器平台

基于three.js的4D旋转曲面空间着色器

Rust AV1解码器性能优化：避免不必要的内存清零和优化结构体比较

OpenAI 的 o3 模型发现 Linux 内核零日漏洞

代码OCR：让截图变代码

从14人团队到高效协作：一个关于专业化与通才化的故事

Java 紧凑对象头正式成为产品特性

Hotspot：Linux性能分析的GUI利器

Dijkstra眼中的Ada语言提案：一场技术与混乱的较量

Debian软件包变更原因详解

Inigo Quilez的计算机图形学教程宝库

DuckDB在2012款MacBook Pro上的惊人表现：我们是否在分布式架构上浪费了十年？

Kotlin语言服务器：尚在实验阶段的VS Code扩展

一篇论文从拒稿到接收的蜕变：页面一的重要性

用大型语言模型和MCP服务器查找邮件中的信息