Hyperfine:一款命令行基准测试工具
Hyperfine是一款命令行基准测试工具,支持统计分析、任意shell命令、缓存清理、参数化基准测试以及结果导出为CSV、JSON、Markdown等格式。它适用于Linux、macOS、Windows等多个平台,可以通过多种方式安装,例如dpkg、Homebrew、cargo等。Hyperfine通过多次运行命令并进行统计分析,可以帮助用户精确地评估不同命令或程序的性能。
阅读更多
Hyperfine是一款命令行基准测试工具,支持统计分析、任意shell命令、缓存清理、参数化基准测试以及结果导出为CSV、JSON、Markdown等格式。它适用于Linux、macOS、Windows等多个平台,可以通过多种方式安装,例如dpkg、Homebrew、cargo等。Hyperfine通过多次运行命令并进行统计分析,可以帮助用户精确地评估不同命令或程序的性能。
阅读更多
本文介绍了PyTorch的自动微分引擎Autograd,以及计算图的概念。文章通过一个简单的五神经元网络示例,演示了如何使用链式法则计算梯度,并解释了计算图如何简化梯度计算过程。文章还介绍了PyTorch中的Tensor数据结构、grad_fn属性和Function类,以及如何使用requires_grad属性和torch.no_grad()上下文管理器来控制梯度计算。最后,文章比较了PyTorch的动态计算图和TensorFlow的静态计算图的差异,并提供了一些使用技巧。
阅读更多
文章介绍了如何使用Mixedbread库进行高效的批量奖励模型推理,以及如何利用Modal部署奖励模型API。作者使用了RLHFlow/ArmoRM-Llama3-8B-v0.1奖励模型,并通过TruthfulQA数据集的子集对其进行了评估,结果显示正确答案的平均排名为2.10,排名第一的概率为53%。此外,文章还探讨了最佳N采样方法,发现使用奖励模型和最佳16采样可以使Llama-3.1-8B-Instruct的零样本准确率提高20.7%。
阅读更多
本文总结了作者在公司构建可观测性平台的经验。作者从最初的 EFK 技术栈出发,由于其资源占用大、查询性能慢、缺乏灵活性等问题,转向了 ClickHouse 和 Grafana 的组合。作者详细比较了 Loki + Grafana、Timescale/InfluxDB + Grafana、SigNoz 等备选方案,最终选择了 ClickHouse 作为数据仓库,Grafana 作为可视化和告警工具,并结合 Fluent Bit 和 Vector 进行日志收集和处理。文章还介绍了 ClickHouse 和 Grafana 的集成、使用技巧、以及未来改进方向。
阅读更多
Cerebras宣布其推理平台运行Llama 3.1 405B模型的速度达到969 tokens/s,创下新纪录,比GPT-4o快12倍,比Claude 3.5 Sonnet快18倍。该平台在128K上下文长度下实现了最高性能和最短的首个token延迟。Cerebras表示,这是第一个以即时速度运行的前沿模型,允许文本、代码和数学页面快速完成。此外,Cerebras公布了Llama 3.1 405B推理服务的定价,并强调了对开源AI运动的支持。
阅读更多
Fast GraphRAG是一个简化的、可提示的快速图RAG框架,专为可解释的、高精度的、代理驱动的检索工作流而设计。它具有快速、低成本、高效的特点,支持动态数据和增量更新,并利用基于PageRank的图探索来提高准确性和可靠性。该框架易于安装和使用,提供异步和类型支持,并可与不同的OpenAI API兼容语言模型和嵌入器配合使用。Fast GraphRAG旨在无缝集成到检索管道中,提供高级RAG的功能,而无需构建和设计代理工作流的开销。
阅读更多
印度马鲁蒂铃木公司生产的Dzire轿车,起售价仅8000美元,却在Global NCAP碰撞测试中获得了成人乘客安全五星和儿童乘客安全四星的高评级。该车标配6个安全气囊、ESP、坡道辅助和行人保护功能。本次测试结果与上一代Dzire相比有了显著提升,上一代车型仅获得两星评级。
阅读更多
本文探讨了Chrome浏览器是否会重蹈IE浏览器覆辙,最终走向衰落。文章指出,Chrome因其高市场份额,与曾经的IE一样,面临着批评和质疑。Chrome被指责速度慢、资源占用高、不兼容开放网络标准,且在隐私保护方面存在问题。虽然Safari和Firefox等浏览器在某些方面表现优异,但由于跨平台支持不足或市场份额下滑等原因,难以挑战Chrome的统治地位。微软的Edge浏览器凭借其跨平台支持和与Chromium的兼容性,被认为是潜在的挑战者,但目前市场份额有限。文章认为,理想状态或许是多个浏览器共存,共同支持开放网络标准,从而避免单一浏览器垄断。
阅读更多
本文探讨了修改Chromium的挑战,指出由于Chromium的广泛应用和快速迭代,直接修改或分支Chromium都存在困难。Electron作为基于Chromium的项目,也面临着同样的问题。作者提出了一种更便捷的扩展Electron的方法,即通过预定义的扩展点和构建脚本,允许开发者添加自定义模块,而无需直接修改Electron代码库。文章列举了渲染Markdown、替换资源、自定义协议等示例,展示了这种方法的灵活性。最后,作者呼吁Electron项目采用这种扩展性方法,以方便开发者为其应用添加特定功能。
阅读更多
文章讲述了一个名叫Miles的大学生,对Unix系统一知半解,过于自信地使用`rm -rf ~*`命令试图清理Emacs备份文件,结果意外删除了所有用户的主目录。由于系统管理员疏忽,Miles获得了过高的权限。最终,管理员恢复了文件,修改了权限,Miles也得到了教训,并成为了一名AS/400系统管理员。
阅读更多
本文作者介绍了Storyteller,一个开源的电子书和有声书自动同步平台。为了实现文本和音频的同步,Storyteller使用了强制对齐技术,其中涉及音频转录和模糊匹配算法。作者详细解释了如何利用Levenshtein距离计算文本和转录之间的差异,并指出了该方法在处理拼写相近但发音相同的单词时的局限性。随后,作者引入了语音编码算法,如Soundex、NYSIIS、Daitch-Mokotoff Soundex、Metaphone和Beider-Morse Phonetic Matching (BMPM),并重点介绍了BMPM在处理发音相似但拼写不同单词方面的优势。最后,作者从语音匹配算法的应用联想到犹太人在离散状态下寻找联系和历史的努力,并分享了与家人关于犹太身份认同的讨论。
阅读更多
LLaVA-o1是一种新型视觉语言模型,旨在进行自主多阶段推理,包括总结、视觉解释、逻辑推理和结论生成等步骤。与思维链提示不同,LLaVA-o1独立地进行这些阶段。通过使用10万个训练样本和一种简单的推理时间缩放方法,LLaVA-o1在各种多模态推理基准测试中,不仅比其基础模型提高了8.9%,而且还超过了更大的模型,甚至包括Gemini-1.5-pro、GPT-4o-mini和Llama-3.2-90B-Vision-Instruct等闭源模型。
阅读更多
糟糕艺术博物馆(MOBA)是世界上唯一致力于收藏、展览和庆祝不被传统艺术博物馆接纳的艺术的博物馆。该博物馆位于波士顿多切斯特酿酒公司内,免费开放。MOBA收藏的艺术作品都是创作者真诚的表达,但由于某些原因导致作品呈现出引人注目且有趣的糟糕效果。馆内展品遍布酿酒公司的各个角落,包括吧台、游戏室、楼梯间甚至电梯井外部和冷藏室。
阅读更多
Documind是一个利用AI从PDF文档中提取结构化数据的开源平台。它能够将PDF转换为图像,使用OpenAI的API提取信息,并根据自定义模式格式化结果。用户可以定义提取模式以处理不同格式的文档。Documind支持本地和云端部署,即将推出托管版本,提供更便捷的使用体验。使用前需要安装Ghostscript、GraphicsMagick、Node.js和NPM等依赖,并设置环境变量。
阅读更多
GaussianAnything是一个新颖的3D生成框架,采用级联3D扩散流程,可根据单视图图像或文本生成高质量、可编辑的曲面高斯模型。它使用带有多视图姿态RGB-D-N渲染的变分自动编码器(VAE),其独特的潜在空间设计保留了3D形状信息。该方法支持多模态条件3D生成,允许点云、文本描述和单/多视图图像输入。此外,新提出的潜在空间能够进行几何-纹理解耦,从而支持3D感知编辑。实验结果表明,GaussianAnything在多个数据集上优于现有方法。
阅读更多
麻省理工学院的工程师们开发了一种新型太阳能海水淡化系统,该系统可根据太阳能的变化实时调整淡化速度。与其他设计不同,它无需电池或备用电源即可最大限度地利用太阳能。该系统在为期六个月的新墨西哥州地下水井测试中,即使在天气和光照条件变化的情况下,平均也能利用超过 94% 的太阳能板电力,每天生产高达 5000 升水。该系统主要用于淡化微咸的地下水,为缺乏淡水资源的内陆社区提供低成本的饮用水。
阅读更多
本文介绍了 IBM 704/709/7090/7094 的 FORTRAN II 编译器的源代码超文本版本。该版本由 John W. Backus 等人编写,并由 Bob Abeles 等人重建。代码最初以打印列表的形式保存,后被重建为可汇编文本。该超文本版本提供了代码列表、交叉引用信息以及每个汇编的索引页面,方便用户查看符号的定义和使用。代码行包含标志、地址、汇编、行号、位置、操作和变量字段/注释等信息。
阅读更多
大型语言模型(LLM)质量的不断提高,推动了各种下游任务的发展,导致对AI自动化的需求增加,并激发了人们对开发基于基础模型(FM)的自主Agent的兴趣。随着AI Agent系统处理更复杂的任务并不断发展,它们涉及更广泛的利益相关者,包括Agent用户、Agent系统开发人员和部署人员以及AI模型开发人员。为了构建可靠的AI Agent和LLM应用程序,有必要转向设计AgentOps平台,以确保整个开发到生产生命周期的可观测性和可追溯性。本文综述了AgentOps的必要特性,并提出了Agent生产生命周期中可观测性数据/可追溯性工件的全面概述,强调了可观测性/可追溯性在增强自主Agent系统可靠性方面的关键作用。
阅读更多
南加州大学、西北大学、香港大学、中国科学院等机构的研究人员开发了一种新型多栅范德华界面结晶体管,可用于创建可重构的模糊逻辑硬件。该晶体管基于二硫化钼,能够在单个设备内生成高斯或π形隶属函数,相较于需要数十个晶体管的传统CMOS技术,效率更高、功耗更低。研究人员将这些晶体管与外围电路集成,创建了可重构的模糊逻辑硬件,并用其运行了一个简单的卷积神经网络,成功完成了图像分割任务。该设计有望推动边缘设备运行深度学习算法能力的提升。
阅读更多
本文作者Max Bo认为HTML的潜力未被充分挖掘,尤其在科学出版领域。文章展示了如何使用HTML、CSS和JavaScript创建一个类似交互式笔记本的环境,可以直接在HTML文件中进行数据探索、分析、可视化和最终发布。文中演示了如何结合Observable标准库、Plot库、SQLite、Python(通过Pyodide)、R(通过WebR)等工具,实现代码高亮、代码执行、数据可视化、数据库查询等功能,并将这些功能封装成可复用的单元格组件。作者还介绍了如何处理用户输入、状态变化以及创建幻灯片放映等功能。最终,作者将这些功能打包成一个名为@celine/celine的库。
阅读更多
文章探讨了雇主与员工之间关于留任的博弈。作者认为,员工应以自身职业发展为优先,在工作满足其需求时留下。公司也应以是否合适为标准雇佣员工,并积极为员工创造发展机会。文章强调了区分“超级巨星”和“单点故障”员工的重要性,并建议公司主动识别和激励前者,同时降低对后者的依赖。此外,文章还讨论了建立公平的薪酬体系,以及员工与管理者之间坦诚沟通离职意向的重要性,指出例外情况的处理方式及其潜在风险。
阅读更多
Jeff Geerling 宣布在树莓派5上成功运行AMD 6000和7000系列显卡,例如Radeon PRO W7700。尽管受限于树莓派的单PCIe 3.0通道和CPU/内存性能,4K分辨率下开启光追的游戏帧率仅有10-20fps,但旧游戏如Portal 2能以4K 60fps流畅运行。文章详细介绍了如何在树莓派5上配置AMD 7000系列显卡,包括内核编译、固件安装等步骤,并展示了多显示器输出、硬件转码等功能测试结果。同时,文章也列出了一些目前尚不支持的功能,例如部分需要反作弊的Steam游戏、ROCm/CUDA加速的LLM等。
阅读更多
Nokolexbor 是一个 Nokogiri 的替代品,速度提升显著,解析 HTML 的速度提高了 5.2 倍,CSS 选择器的速度则最高提升了 997 倍。它是一个基于 Lexbor 的 Ruby 高性能 HTML5 解析器,支持 CSS 选择器和 XPath,API 设计尽可能与 Nokogiri 兼容。基准测试显示,在解析谷歌结果页面和使用 CSS 选择器方面,Nokolexbor 比 Nokogiri 快得多,但在 XPath 方面两者速度相近。
阅读更多
Nova 是一个用 Rust 编写的 JavaScript 和 WebAssembly 引擎,以库的形式提供 API 供 Rust 项目调用,并作为 JavaScript 代码的运行时环境。它的执行模型深受 Kiesel 和 SerenityOS 的 LibJS 启发,采用数据驱动设计,核心团队在 Discord 服务器上活跃。该项目目前仍处于开发阶段,尚不适合实际使用。它在芬兰 Rust-lang meetup 和 Web Engines Hackfest 2024 上进行了演讲,重点介绍了 JavaScript 引擎的工作原理、Nova 的设计选择以及数据驱动引擎设计的优缺点。
阅读更多
本文探讨了如何在 Go 应用程序中利用机器学习模型,特别是大型语言模型(LLM)。文章首先介绍了使用现成的互联网 LLM 服务(如 ChatGPT 和 Gemini)以及本地运行的开源模型(如 Llama 和 Mistral)的简便方法,并推荐使用 Ollama 或 Llamafile 等工具简化本地模型部署和 API 调用。接着,文章深入讲解了如何使用 Python 作为辅助程序,通过自定义模型实现更高级的定制化。文章以 Gemma 和 JAX 为例,演示了如何构建一个 Python 服务器,通过 REST API 为 Go 应用程序提供本地 LLM 推理服务。此外,文章还展示了如何使用 TensorFlow 和 Keras 训练一个简单的图像分类模型,并通过 Unix 域套接字实现 Go 客户端与 Python 服务器之间的低延迟通信。
阅读更多
Wiby是一个致力于搜索经典网络内容的搜索引擎,提供页面提交入口、设置选项以及惊喜功能。用户可以通过“About”、“Privacy”和“Donate”等链接了解更多信息或进行捐赠。
阅读更多
Notion是一款多合一的工作区软件,它集成了笔记、任务、维基和数据库功能,旨在提供一站式的工作管理平台。用户可以在Notion上创建笔记、管理任务、构建维基知识库以及管理数据库,从而提高工作效率。
阅读更多
iOS 18 引入了一项新的安全功能:非活动重启。该功能会在设备闲置72小时(3天)后自动重启,旨在增强安全性,防止长时间未解锁的设备被攻击者利用漏洞访问解密后的用户数据。该机制由安全隔离区处理器(SEP)计时,并在时间达到后通知 AppleSEPKeyStore 内核模块启动重启。此功能对执法部门和普通用户都有影响,执法部门需要在72小时内获取数据,而普通用户的数据更加安全。
阅读更多