核手提箱 海洋云增白 可扩展服务 policy 颈挂空调 计算机硬件 极端主义 PostgreSQL AI工具 儿童读物 化学 即时消息 代码审查 反向工程 KDE 数据安全 效率工具 超级计算机 植物学 分析化学 插图 Three.js 泄露 大会 初创 Verizon 海水淡化 GPT-3 加速器项目 更多

用100行Julia代码实现最先进的RAG精确二进制向量搜索 (domluna.com)

这篇文章探讨了如何利用二进制向量空间快速执行精确的RAG查找。文章认为二进制向量在保持高精度的同时,可以显著降低服务器成本,并使内存检索变得更加可行。文章使用Julia语言实现了一个高效的二进制向量搜索算法,并通过基准测试证明了其性能优于现有最先进的解决方案。文章还讨论了数据集大小与精确暴力搜索可行性之间的关系,并得出结论:即使对于相当大的数据集,精确的二进制向量搜索也是可行的。

海豚模拟器 - 超级着色器:不可能问题的荒谬解决方案 (dolphin-emu.org)

本文介绍了海豚模拟器长期存在的一个问题:着色器编译卡顿。由于GameCube/Wii的GPU架构限制,模拟器需要实时将游戏使用的着色器配置转换为现代GPU可执行的代码,导致游戏运行过程中出现卡顿。文章详细解释了这个问题的根源,并探讨了多种解决方案,包括预先生成所有着色器、预测游戏所需的着色器、共享着色器和异步着色器编译。最终,开发者采用了超级着色器方案,通过在GPU上运行一个解释器来模拟GameCube/Wii的渲染流程,从而避免了实时编译着色器。文章还介绍了超级着色器的开发历程、混合模式超级着色器以及各种GPU驱动程序和API的局限性。

切片敲击玩具 (memalign.github.io)

Slice Tap Toy是一款来自memalign.github.io的玩具,更多信息请访问网站获取。

混凝土之美 - 正在进行的作品 (worksinprogress.co)

本文探讨了建筑装饰在现代建筑中的衰落。作者反驳了装饰衰落是由于劳动力成本上升的“供给侧”解释,认为技术进步实际上降低了装饰品的生产成本。作者指出,装饰在平民住宅中仍然很普遍,这表明其衰落并非由于负担能力问题,而是由于现代主义等文化选择导致的需求变化。

Clubhouse 如何在 6 个月内利用 Postgres 从 1 万用户扩展到 1000 万用户 (www.stepchange.work)

本文介绍了 Clubhouse 软件工程师 Luke Demi 如何在 6 个月内将 Clubhouse 的后端基础设施从 1 万用户扩展到 1000 万用户。Clubhouse 的后端是一个建立在 Postgres 上的 Django 应用程序,最初的架构在 Heroku 上,但由于 Heroku 的局限性,Clubhouse 团队不得不迁移到 AWS 和 Aurora Postgres。文章详细介绍了迁移过程中的挑战,包括 Postgres 资源限制、实时feed 和状态表查询问题、数据库迁移方法等,以及迁移后的性能观察、扩展挑战和解决方案,最后总结了从 Clubhouse 的快速增长和扩展过程中得到的经验教训。

学者发现罕见16世纪史书,附有约翰·弥尔顿手写笔记 (arstechnica.com)

学者们在凤凰城公共图书馆发现了一本罕见的16世纪霍林斯赫德编年史,其中包含约翰·弥尔顿手写的笔记。这使得这本书格外特别,因为目前仅存的弥尔顿私人藏书中只有另外两本包含了他的手写笔记。这本编年史是英国历史的重要资料,也是莎士比亚历史剧的主要来源。弥尔顿的笔记显示了他对书中内容的仔细研读,以及他对某些内容的批判态度,例如他对征服者威廉的母亲阿尔莱特不雅轶事的批评。

两名圣克鲁斯学生发现安全漏洞或致数百万人免费洗衣 (techcrunch.com)

加州大学圣克鲁斯分校的两名学生发现了一个安全漏洞,该漏洞可能允许任何人免费使用由CSC ServiceWorks运营的100多万台联网洗衣机。尽管学生们多次尝试联系CSC ServiceWorks以修复此漏洞,但该公司一直没有回应。该漏洞存在于CSC移动应用程序使用的API中,允许任何人绕过安全检查并直接向CSC的服务器发送命令,从而在不支付任何费用的情况下操作洗衣机。

关于第二代电子邮件的思考 (gabrielsieben.tech)

本文作者探讨了现有电子邮件系统存在的缺陷,包括缺乏规范、安全漏洞、垃圾邮件泛滥等问题,并提出构建第二代电子邮件系统的设想。作者建议采用类似HTTP到HTTPS的过渡方式,引入新的DNS记录MX2,逐步淘汰旧系统。第二代电子邮件系统将优先考虑标准化HTML规范、邮件链偏好设置、强制文本副本、基于公钥的邮件认证等功能,并通过域名信誉取代IP信誉来对抗垃圾邮件。

第三次: 一种更好的工作方式 (www.lesswrong.com)

文章介绍了一种名为“第三次”的时间管理方法,主张工作一段时间后休息对应三分之一的时间。这种方法比传统的番茄工作法更加灵活,能够适应不同的工作节奏和突发事件,并鼓励高质量的专注工作和充分休息。文章详细介绍了“第三次”方法的具体步骤,包括如何处理中断、安排午休和晚餐时间,以及根据不同工作类型调整休息时间比例等。

微软称如果用户在Edge浏览器中未使用必应,则用户的电脑需要“修复” (www.tomsguide.com)

微软的电脑管家应用近日被发现,其“修复建议”功能会建议用户将Edge浏览器的默认搜索引擎重置为必应,即使用户已经更改为其他搜索引擎。这一行为被认为是微软在推广自家产品方面的新举措,尽管该应用并非默认安装,且用户需要主动更改搜索引擎才会受到影响,但这种做法仍然引发了争议,被指责为“令人厌恶”。多年来,Windows 11 一直因推广其他微软服务而受到批评,尽管每次都引发了强烈抗议,但微软似乎并未改变其做法。

一种用于计数不同元素的迷人算法 (justinjaffray.com)

本文介绍了一种名为“Distinct Elements in Streams: An Algorithm for the (Text) Book”的论文中提出的计数不同元素的算法。该算法通过动态调整概率p来控制集合的大小,从而实现对不同元素数量的估计。文章首先介绍了传统的基于哈希表的精确计数方法,然后逐步推导出这种基于概率的近似算法。算法的核心思想是,当集合大小达到阈值时,将概率p减半,并对集合中的元素进行筛选,以确保每个元素都有p的概率被保留。最终,集合大小除以p即为不同元素数量的估计值。

EquityVal:面向日常投资者的股票估值工具 (www.useequityval.com)

EquityVal是一个面向日常投资者的股票估值工具,它允许用户创建、保存和分享任何上市公司的估值模型,以帮助他们做出投资决策。该工具提供完全可定制的模型,用户可以编辑DCF模型的每个输入,以根据自己的假设进行微调。它还提供任何上市公司的最新准确数据,以加强研究。用户可以保存他们的模型,以便随时查看和调整。

持久耐用的梯子:解读拉斐尔·塞缪尔 (www.lrb.co.uk)

文章介绍了历史学家拉斐尔·塞缪尔,他以其对大众记忆和历史工作坊的研究而闻名。塞缪尔主张“人民的历史”,主张扩大历史写作的主体、内容和素材来源,并通过对19世纪英国的研究,挑战了工业革命的传统叙述。他认为,经济增长根植于小规模企业,手工劳动仍然发挥着重要作用,机械化进程缓慢且不均衡。此外,他还关注劳工的实际经历,以及帝国、民族主义和公共历史等议题。

乐高积木搭建埃舍尔的《阳台》 (www.andrewlipson.com)

本文介绍了作者用乐高积木搭建埃舍尔作品《阳台》的创作过程。作者详细描述了搭建过程中的挑战,包括解读埃舍尔作品中的扭曲结构、使用摄影技巧拼接最终图像以及搭建过程中遇到的各种困难。最终,作者成功地用乐高积木再现了埃舍尔的《阳台》,并展示了模型的细节和搭建过程中的照片。

为何不使用双轴图表,以及替代方案 (blog.datawrapper.de)

本文探讨了数据可视化中使用双轴图表(dual axis charts)的弊端,并提供了替代方案。作者指出,双轴图表容易误导读者对两组数据之间关系的理解,因为双轴图表的比例可以被任意操纵。文章提出了四种替代方案:并排图表(side-by-side charts),指数图表(indexed charts),优先级排序和标签(prioritizing & labeling),以及连接散点图(connected scatterplot)。作者认为,在大多数情况下,前两种方案最为实用。

用户强烈抗议Slack抓取客户数据用于AI模型训练 (www.securityweek.com)

企业协作平台Slack被曝一直在抓取客户数据,包括消息、文件和使用信息,以开发新的AI和ML模型,引发了隐私争议。默认情况下,Slack系统会分析客户数据和使用信息来构建AI/ML模型以改进软件,用户无需选择加入。虽然Slack坚称其拥有技术控制措施来阻止其访问底层内容,并承诺数据不会跨工作场所泄露,但企业Slack管理员仍在争相选择退出数据抓取。

关于分子塑料回收的尖锐问题和诚实的答案 (www.plasticstoday.com)

本文探讨了分子回收的可行性,将其比作特斯拉的电动汽车革命。作者认为,尽管分子回收在技术上是可行的,但商业可行性和执行力是成功的关键。文章还提出了评估分子回收企业成功与否的关键问题,涵盖了商业模式、经济效益、法规遵从性、运营效率、原料组成等方面。作者认为,分子回收要想取得成功,需要整合硬件、软件和其他系统以应对复杂的运营参数,并建立一个涵盖从上游收集到下游处理的端到端业务。

反对公平 | 游戏之道 (taogaming.wordpress.com)

本文作者认为,在游戏中,公平被高估了。作者通过分析对称性、随机性和战争迷雾等游戏机制,指出不公平的游戏往往更令人难忘,并以体育比赛和游戏中的例子说明了这一点。作者认为,虽然完全不公平的游戏可能令人不快,但适度的“不公平”可以创造出引人入胜的游戏体验,并留下难忘的故事。

函数式语言中消除样板代码 (lambdaland.org)

本文介绍了作者在使用函数式语言Elixir编写程序时,如何解决样板代码问题。作者通过一个具体的例子,展示了如何使用writer monad来抽象化代码中的额外信息,从而提高代码的可读性和灵活性。作者还讨论了monad的概念、不同类型的monad,以及如何在非Haskell语言中使用monad。

AliceVision | 摄影测量计算机视觉框架 (alicevision.org)

AliceVision是一个摄影测量计算机视觉框架,提供了一套用于3D重建的算法和工具。该框架允许用户从图像集合中创建3D模型,并支持各种功能,包括特征提取、图像匹配、相机姿态估计和密集点云生成。AliceVision旨在提供一个灵活且用户友好的平台,用于研究和开发摄影测量应用程序。

苹果限制第三方浏览器引擎工作在欧盟设备上 (www.theregister.com)

苹果公司正在限制第三方浏览器引擎的开发和测试,要求开发者必须位于欧盟地区才能在真机上进行测试。这被认为是对欧盟数字市场法案(DMA)的恶意遵从,因为它给欧盟以外的开发者带来了额外的障碍,并可能阻碍竞争。批评人士认为,苹果的这一举措是为了让Safari浏览器在iOS平台上保持主导地位,而损害了消费者的选择权。

GLEWBOT:像壁虎一样攀爬建筑物以检查墙砖 (blog.arduino.cc)

GLEWBOT是一款受壁虎启发,用于检查建筑物外墙砖的机器人。它采用类似攀岩者使用上升器的两部分设计,通过吸盘抓住瓷砖,并使用线性致动器进行伸展/收缩,从而攀爬墙壁。GLEWBOT配备了两个Arduino板,一个用于中央命令和一般功能,另一个用作声音识别模块并控制检查工具。该工具是一个空心鼓锤,敲击每个瓷砖并聆听产生的回声,通过音频分类模型识别有问题的瓷砖。

GitHub - HigherOrderCO/Bend (github.com)

Bend 是一种大规模并行的高级编程语言,具有类似 Python 和 Haskell 的表达能力,支持快速对象分配、高阶函数、闭包、递归和延续。它可以在 GPU 等大规模并行硬件上运行,具有接近线性的加速比,无需显式并行注释。Bend 由 HVM2 运行时提供支持,可以通过简单的代码实现高效的并行计算,例如递归分治方法。Bend 还支持各种并发系统,例如着色器和 Erlang 式的 actor 模型,可以通过全局 beta 约简和 HVM2 的原子链接器实现长距离通信。

Rust 1.78:128 位内存对齐修复对性能的影响 (codspeed.io)

Rust 1.78.0 版本于 2024 年 5 月 2 日发布,该版本完成了 x86 架构的 u128/i128 更改,对使用 128 位整数的代码可能会有性能提升。文章深入探讨了内存对齐问题如何影响性能,并通过实例演示了 Rust 1.76.0 中 128 位整数的 8 字节对齐导致的性能下降,以及通过强制 16 字节对齐来优化性能的方法。文章还使用 CodSpeed 运行器进行基准测试,比较了不同对齐方式下的性能差异,并证实了 Rust 1.78.0 版本解决了对齐问题,提升了代码性能。

试验性HIV疫苗在人体内触发了难以捉摸且必需的抗体 (corporate.dukehealth.org)

杜克大学人类疫苗研究所开发的一种HIV候选疫苗在2019年一项小型临床试验中,触发了参与者体内低水平的广谱中和抗体。这项发表在《细胞》杂志上的研究结果不仅证明了疫苗可以引发这些抗体来对抗不同的HIV病毒株,而且还可以在几周内启动这一过程,从而启动必要的免疫反应。该候选疫苗针对HIV-1外膜上的一个称为膜近端外部区域(MPER)的区域,即使病毒发生变异,该区域也保持稳定。

“以我平常的方式进行报道是不可能的”:瑞秋·艾维夫如何写出《纽约客》关于露西·莱特比的故事 (www.niemanlab.org)

本文介绍了瑞秋·艾维夫撰写《纽约客》关于露西·莱特比案件报道的幕后故事。艾维夫对案件的报道提出了质疑,认为媒体对莱特比的定罪过于肯定,忽略了其他可能性。她详细介绍了自己如何获取法庭记录和医院记录,并采访了相关人员,最终完成了这篇报道。文章还探讨了英国媒体在报道该案件时受到的限制,以及这些限制如何影响公众对案件的看法。

stevekrouse/staticWordle | Val Town (www.val.town)

这篇文章介绍了一个名为 staticWordle 的项目,这是一个使用 Val Town 构建的静态 Wordle 游戏。该游戏将游戏状态存储在 URL 栏中,玩家可以通过链接分享游戏进度,也可以通过后退按钮撤销操作。此外,文章还介绍了如何生成新的游戏链接并分享给朋友,以及构建静态游戏(如 staticWordle 和 staticChess)的关键要素:游戏状态的表示方法、游戏状态的编码/解码方式、游戏状态的渲染方式、链接的放置方式以及 CSS 美化。

OpenAI 长期人工智能风险团队解散 (www.wired.com)

OpenAI专注于人工智能潜在风险的团队已经解散,其成员要么辞职,要么被并入其他研究小组。该团队名为“超级对齐团队”,由OpenAI首席科学家Ilya Sutskever和前DeepMind研究员Jan Leike共同领导,旨在研究如何控制超级人工智能,防止其失控。团队解散的原因可能是公司内部动荡以及对人工智能风险的担忧降温。OpenAI表示,将由John Schulman领导与更强大模型相关的风险研究。

Multics Emacs:历史、设计与实现 (www.multicians.org)

本文回顾了Multics Emacs的背景、历史和设计。Multics Emacs是一个运行在Honeywell Multics系统上的实时、面向视频的文本编辑器。文章详细介绍了其设计和实现细节,包括基本编辑器、交互式驱动程序和重显示算法。重点讨论了性能增强技术,例如回显协商和快速重显示。文章还探讨了扩展语言,该语言允许用户使用Lisp增强编辑器功能。Multics Emacs对Multics产生了重大影响,激发了人们对集成视频支持的兴趣,并促进了Lisp的使用。

我们离通用人工智能还有多远? (arxiv.org)

这篇论文探讨了人工智能(AI)的进化及其对通用人工智能(AGI)的影响。文章首先定义了AGI,并将其与当前的AI区分开来,强调了AGI在执行各种现实世界任务方面的效率和效能,可与人类智能相媲美。论文进一步探讨了实现AGI所需的能力框架,包括内部、接口和系统层面。此外,文章还讨论了必要的AGI校准技术,以协调更先进的功能和严格的约束条件,强调负责任地开发AGI的重要性。最后,论文概述了AGI在多个领域的现有挑战和潜在途径,旨在促进对AGI现状和未来发展方向的共同理解。

2 4 5 6 7 8 9 101 102