如何检测大型语言模型的不确定性

2024-10-25

本文介绍了Entropix项目如何通过在不确定性情况下进行更智能的采样来改进大型语言模型的推理能力。Entropix使用熵和变异熵来度量模型预测的不确定性,并根据不同的不确定性状态采取不同的采样策略,例如分支预测或插入“思考”标记。文章还讨论了注意力熵和注意力一致性作为衡量不确定性的其他指标。

阅读更多
未分类

难以掌控的理论:把手理论的难题

2024-11-10

本文探讨了“把手”的概念,并列举了粉笔、香烟、肥皂等难以界定把手的物品。作者从这些“难题”出发,分析了把手的几个关键特征:必须易于抓握、与主体分离、具有服务功能、人造而非自然。文章还探讨了名字作为一种特殊的“把手”的可能性,以及香烟作为一种短暂的“生活把手”的隐喻。最后,作者反思了在日常生活中,一些曾经常见的物品(如粉笔、香烟)逐渐被淘汰的现象,以及它们残留的“把手”所引发的思考。

阅读更多
未分类 把手 日常物品

英特尔CEO格尔辛格离职:巨头陨落?

2024-12-18

本文探讨了英特尔CEO帕特·格尔辛格的离职。格尔辛格曾被寄予厚望,期望他能重振英特尔,但三年任期内未能扭转公司在竞争日益激烈的市场中的颓势。文章分析了多方面原因,包括错失移动市场机遇、AI浪潮冲击、地缘政治因素以及与政府合作的延误等。最终,格尔辛格的离职被认为是英特尔自身长期积弊以及外部环境变化共同作用的结果,英特尔的未来走向仍不明朗。

阅读更多

iFixit发布循环电子设计指南

2024-10-29

iFixit参与了埃森哲循环电子设计指南的撰写,该指南为消费电子领域的原始设备制造商(OEM)提供路线图,指导其进行可持续的电子产品设计。iFixit强调了沟通在创建强大的维修生态系统中的重要性,并分享了有效沟通的技巧,包括在维修前、维修中和维修后与用户沟通,以及在公司内部建立维修文化。该指南旨在帮助OEM厂商在保护环境的同时,构建可持续发展的电子产品未来。

阅读更多
未分类 电子产品维修

慢慢脱离 Heroku

2024-11-03

作者讲述了其公司 Podia 逐渐脱离 Heroku 平台的过程。Podia 早期受益于 Heroku 的便捷性,但随着 Salesforce 收购 Heroku 后平台停滞不前,以及 Heroku 的各种问题(如 CI 中断、强制维护期、附加组件的高额抽成等),Podia 开始逐步迁移。他们首先将 CI 转移到 GitHub Actions,数据库迁移到 CrunchyData 和 redis.com,以此避免 Heroku 的强制维护期和高额附加组件费用。目前,Podia 只保留了 Heroku 的核心网络和后台进程,并根据成本和收益权衡是否完全迁移。作者建议 Heroku 用户将附加组件转为直接计费、将数据库迁移到托管数据库提供商、将 CI 迁移到其他平台,并根据成本和收益考虑是否迁移计算资源。

阅读更多
未分类

说出素数:人类能否在下一个素数被发现前读完已知最大素数?

2024-11-09

该项目旨在召集人们朗读新发现的最大梅森素数M136279841的每一位数字,并希望在发现更大的素数之前完成。参与者需要认领一段419位的数字,录制自己朗读的视频并上传到YouTube,然后提交视频链接。所有视频将被添加到播放列表中,形成完整的人类朗读这段4100万位素数的记录。

阅读更多
未分类 M136279841

艺术家训练老鼠预测外汇市场

2024-12-19

奥地利概念艺术家Michael Marcovici进行了一个名为“Rat Traders”的项目,训练老鼠预测外汇期货价格。他将价格波动转换为钢琴音符,老鼠通过预测音符变化来预测价格。令人惊讶的是,经过训练的老鼠在几个月内似乎超过了人类交易员,但这缺乏严格的统计检验。Marcovici的项目讽刺了人们对市场预测的迷信,以及人们渴望找到在混沌系统中获利的捷径的心理。最终,该项目因老鼠的交易次数有限而终止,也凸显了市场预测的不可靠性。

阅读更多
杂项

GitHub - pyro-ppl/numpyro:基于NumPy的概率编程,由JAX支持自动微分和JIT编译到GPU/TPU/CPU

2024-11-16

NumPyro是一个轻量级的概率编程库,它为Pyro提供NumPy后端,并依赖JAX进行自动微分和JIT编译到GPU/CPU/TPU。它支持多种推理算法,特别是MCMC算法,如NUTS、HMC、MixedHMC和HMCECS,以及变分推理。NumPyro提供了类似于PyTorch的distributions模块,并支持使用TFP的分布。它还提供了类似Pyro的效果处理器,用户可以轻松扩展它以实现自定义推理算法和实用程序。文章用一个8所学校的例子演示了NumPyro的使用,包括模型定义、MCMC推理、非中心参数化以及使用Predictive类进行预测。

阅读更多
11
未分类 概率编程 MCMC

爱的机器:Raegan Bird 撰文

2024-11-05

Raegan Bird分享了她在怀孕、丧子以及与科技互动过程中的经历和感悟。文章从一次尴尬的线上研讨会开始,探讨了科技的两面性。她讲述了孕期经历的种种科技干预,从令人不适的超声波检查到最终儿子Henry的出生和离世。Henry患有先天性心脏病,出生后便经历了手术,最终在两天后离世。作者描述了手术室的紧张气氛、Henry短暂的生命以及他们一家如何面对失去孩子的悲痛。文章穿插着对科技的思考,以及对人与人之间责任的反思,并以Richard Brautigan的诗歌《爱的机器》作结,表达了对科技与自然和谐共存的期许。

阅读更多

机器征服:儒勒·凡尔纳的技术统治世界建构

2024-10-20

本文从世界建构的角度解读了儒勒·凡尔纳的《奇异旅行》系列小说。作者认为,凡尔纳并非简单地反映19世纪的进步意识形态,而是在进行创造性的全球秩序建构。他将全球秩序构建为技术官僚化的、去政治化的,并且必然是暴力的。这种秩序被白人男性工程师和科学家模棱两可但持续地挪用。作者认为,凡尔纳的全球秩序不是关于国家、主权或政治共同体,而是关于技术官僚冒险家先锋队在全球漫游。这种对世界秩序的构想在当时引起了共鸣,并被用作现实世界干预的灵感来源。

阅读更多

为何反作弊软件需要内核驱动?

2024-10-30

本文解释了为什么反作弊软件Vanguard需要内核驱动。作者首先解释了内核模式和用户模式的区别,以及为什么用户模式的反作弊容易被内核级别的外挂绕过。然后,文章解释了为什么反作弊需要在系统启动时加载,以及它如何确保系统完整性。最后,文章讨论了Vanguard扫描外部设备和潜在安全风险的问题,并指出所有第三方软件都存在供应链攻击的风险,但内核驱动对于反作弊的有效性是必要的。

阅读更多

星际公民与42中队的众筹目标

2024-12-02

本文详细介绍了《星际公民》和《42中队》的众筹目标,列出了从2012年到2014年各个阶段的筹款金额和解锁的游戏内容。这些内容包括新的飞船、游戏机制、星系、扩展的故事线、额外的任务、模组工具、开发团队的网络直播、甚至还有宠物系统等。每个目标的达成都会奖励早期支持者,并展现了游戏开发的完整愿景。

阅读更多
未分类

使用 ImHex 的 DSL(模式语言)可视化二进制文件

2024-11-07

本文介绍了如何使用 ImHex 的模式语言 (DSL) 来可视化和解析二进制文件。作者以解析 SWF 文件格式为例,详细讲解了如何定义结构体、位域、枚举、数组等数据类型,以及如何使用条件语句、匹配语句和循环来处理复杂的二进制数据。此外,文章还介绍了 ImHex 的内置解压缩功能和虚拟文件系统,可以直接在 ImHex 中解压缩和分析压缩的二进制文件。

阅读更多

GitHub - homebrewltd/ichigo: Llama3.1 学会倾听

2024-10-17

🍓 Ichigo(原llama3-s)是一个开源的实时语音AI研究项目,目标是扩展基于文本的LLM,使其具备原生“倾听”能力。它采用受Meta的Chameleon论文启发的早期融合技术,使用WhisperSpeechVQ对连续语音数据进行预训练,并通过在交织的合成数据上进行训练来增强模型的音频指令遵循能力。Ichigo v0.3模型在更清晰、改进的数据集上进行训练,实现了63.79的增强MMLU得分,并展现出更强的语音指令遵循能力,甚至在多轮交互中也是如此。

阅读更多
27
未分类 语音AI

送别:父亲的教诲与人生哲理

2024-12-16

作者从小受父亲教诲,要“总是去参加葬礼”。起初她并不理解,直到成年后才领悟到这不仅仅是礼节,更是对逝者家属的关怀和对人生困境的体悟。父亲的离世让她更深刻地体会到这看似微小的举动,实则蕴含着巨大的力量,它促使我们直面生活中那些令人不快却不得不面对的时刻,并从中感受到人性的温暖与美好。

阅读更多

区分大小写,但既非大写也非小写的字符是什么?

2024-11-06

本文探讨了Unicode中一种特殊情况:标题大小写(Title case)。某些Unicode字符,例如dz (U+01F1 LATIN SMALL LETTER DZ),表示两个图形符号的组合,但占用单个代码点。这些字符主要出现在匈牙利语等语言中,被视为字母表中的单个字母。Unicode包含四个这样的双字母组合,它们具有大写、标题大小写和小写三种形式。文章指出,dz双字母组合的存在源于塞尔维亚-克罗地亚语中拉丁字母和西里尔字母的转换需求。文章还讨论了这种特殊字符在文本搜索中可能导致的问题,例如搜索"mad"不会匹配"madzag",因为"dz"被视为单个字母。

阅读更多
未分类 大小写

朝圣者作为历史学家

2024-11-25

文章探讨了朝圣的意义,作者以自己和朋友的朝圣经历为例,阐述了朝圣不仅仅是宗教仪式,也是一种对历史的体验和感悟。文中描述了他们沿着圣爱德华之路的行走,感受到了千年以前朝圣者的艰辛和虔诚,并通过参观沙夫茨伯里修道院和拉姆斯盖特的圣奥古斯丁教堂等历史遗迹,体会到了历史的厚重感。作者认为,朝圣是一种回到过去的方式,是对物质遗迹之外的精神和历史的敬仰。

阅读更多
未分类 朝圣

考古学家在比利时发现由不同时期至少八人骨骼拼凑而成的骨架

2024-11-10

比利时一个火葬墓地出土了一具由至少八具不同时期人类骨骼拼凑而成的骨架,最早的骨骼可追溯到新石器时代晚期,距今约4445年,而头骨则属于公元三、四世纪的罗马女性。研究人员通过放射性碳测年和古代DNA测序技术确定了骨骼的来源,并推测这可能是罗马人在安葬自己死者时扰乱了旧墓葬,并用自己的头骨“补全”或替换了新石器时代骨架的头骨,也可能是他们特意拼凑了这具骨架。这种做法的目的可能是为了宣示土地所有权。

阅读更多
未分类

丹麦将种植10亿棵树并将10%的农田转变为森林

2024-11-24

丹麦议会达成协议,将在未来二十年内种植10亿棵树,并将10%的农田转变为森林和自然栖息地,以减少化肥使用。政府称该协议是“100多年来丹麦景观的最大变化”。该协议拨款430亿克朗(61亿美元)用于在未来二十年内从农民手中购买土地,新增25万公顷森林,并将目前种植在气候破坏性低洼土壤上的14万公顷土地转变为自然栖息地。目前,丹麦14.6%的土地被森林覆盖。

阅读更多
未分类

关于SQLite最常见的误解

2024-11-09

本文阐述了关于SQLite的一个常见误解:它是一个单连接数据库。作者指出这种说法不仅令人困惑,而且在许多方面都是错误的。SQLite完全支持多并发读取操作。虽然在写入操作时,SQLite数据库引擎会在数据库级别使用写锁,同一时间只有一个连接可以写入,但这通常不是问题。因为可以使用IMMEDIATE TRANSACTION,SQLite可以将查询排队,稍后重试获取写锁。

阅读更多
未分类

数学加速一旦开始就很难停止

2024-11-19

本文讲述了作者的两个孩子在小学阶段就开始数学超前学习,几年后远远超过同龄人。作者一家为此咨询了学校和老师,但没有得到有效帮助,反而遭到质疑。文章探讨了数学加速的利弊,以及如何平衡孩子的学习兴趣和社交发展。作者最终选择尊重孩子的意愿,每天询问是否想学习数学,并分享了其他数学超前家庭的应对方法,包括专注数学竞赛、暂停课外数学学习以及持续进阶等。

阅读更多

iOS 18.2允许欧盟用户删除应用程序商店、Safari、信息、相机和照片

2024-10-24

根据欧盟《数字市场法》的要求,苹果公司在iOS 18.2系统中允许欧盟用户完全删除一些核心应用程序,包括应用程序商店、Safari浏览器、信息、相机和照片。几乎所有应用程序现在都可以在欧盟地区删除,除了电话和设置应用程序。删除的应用程序,例如应用程序商店,可以使用设置应用程序中的“应用程序安装”部分重新下载。

阅读更多

新款 MacBook Pro 搭载 M4 系列芯片,开启 Apple Intelligence 新时代

2024-10-30

苹果公司发布了新款 MacBook Pro,搭载M4、M4 Pro 和 M4 Max 芯片,性能显著提升。新款 MacBook Pro 专为 Apple Intelligence 打造,该个人智能系统可改变用户工作、沟通和表达方式,同时保护隐私。新款提供深空黑和银色两种外观,14 英寸 MacBook Pro 起售价 1599 美元,配备 M4 芯片和三个 Thunderbolt 4 端口,内存 16GB 起步。14 英寸和 16 英寸的 M4 Pro 和 M4 Max 型号配备 Thunderbolt 5,提供更快的传输速度和先进的连接性。所有型号均配备 Liquid 视网膜 XDR 显示屏,新增 nano-texture 显示屏选项,SDR 内容亮度高达 1000 尼特,并配备先进的 12MP Center Stage 摄像头,电池续航时间最长可达 24 小时。新款 MacBook Pro 于 10 月 30 日开始预订,11 月 8 日起正式发售。

阅读更多
未分类

牡蛎墙能否抵御飓风?美国国防部高级研究计划局开展研究

2024-10-13

为了保护海岸线免受日益增强的海浪和风暴潮的侵袭,美国国防部高级研究计划局(Darpa)启动了一项名为“Reefense”的计划,旨在测试“混合”珊瑚礁(将人造结构与牡蛎或珊瑚结合在一起)的防护能力。该计划资助了三个研究小组,其中罗格斯大学团队设计的混凝土结构原型已开始进行测试。该结构旨在吸引牡蛎聚集生长,形成天然屏障,以消散海浪能量。此外,夏威夷大学和迈阿密大学的研究团队也分别在利用珊瑚和人造结构构建混合珊瑚礁方面开展了研究。

阅读更多

向量数据库是错误的抽象

2024-10-30

本文认为向量数据库将嵌入视为独立数据,而非源数据的衍生数据,导致生产环境中出现同步和管理难题。文章提出了一种名为“向量器”的更好抽象,将嵌入视为类似数据库索引,自动保持嵌入与源数据同步。并介绍了在PostgreSQL中实现的pgai Vectorizer工具,它利用pgvector和pgvectorscale扩展进行向量搜索,简化了嵌入管理,并允许开发者专注于应用构建。

阅读更多
未分类 pgai Vectorizer
1 2 87 88 89 91 93 94 95 540 541