大型语言模型推理中的非确定性:根源与解决方案

2025-09-11
大型语言模型推理中的非确定性:根源与解决方案

大型语言模型(LLM)推理结果的不可复现性是一个长期问题。本文深入探讨了其根本原因并非简单的浮点运算非结合性和并发执行,而是由于内核实现中缺乏“批处理不变性”。即使单个内核是确定性的,但批处理大小的非确定性变化(由服务器负载决定)会影响最终结果。文章分析了RMSNorm、矩阵乘法和注意力机制中批处理不变性的实现挑战,并提出了一种通过调整内核实现来消除非确定性的方法,最终实现了LLM推理的完全可复现性,并对强化学习训练产生了积极影响。

阅读更多
AI

英特尔Mount Morgan IPU:云计算基础设施的强大引擎

2025-09-11
英特尔Mount Morgan IPU:云计算基础设施的强大引擎

英特尔发布了新款Mount Morgan IPU,旨在进一步提升云计算基础设施的效率。它配备了24个Arm Neoverse N2核心、改进的加速器和更高的带宽,能够处理更广泛的基础设施服务,包括虚拟机配置、指标收集和网络功能。与前代产品相比,Mount Morgan拥有更强大的计算能力、更快的内存带宽以及增强型加密和压缩引擎,支持非对称加密算法,并能实现高达400 Gbps的以太网吞吐量。其灵活的架构允许它以多种模式运行,包括作为独立服务器或与多达四个主机服务器协同工作。Mount Morgan代表了英特尔在云计算硬件加速领域的重大进展,试图在竞争激烈的市场中占据一席之地。

阅读更多
硬件 IPU

挪威军舰碰撞沉没事故:人为失误酿成巨灾

2025-09-11
挪威军舰碰撞沉没事故:人为失误酿成巨灾

2018年,挪威海军护卫舰“海尔格·英格斯塔德”号与油轮相撞沉没,造成巨额经济损失和声誉损害。调查显示,事故原因为人为失误,包括舰桥值班人员经验不足、对灯光判断失误、缺乏有效的雷达和AIS使用,以及沟通协调不畅。事故暴露了挪威海军在训练、人员经验、以及应急响应方面的不足,也引发了对现代化军舰设计和损管能力的反思。尽管该事故未造成人员伤亡,但其沉没凸显了即使在和平时期,训练不足和人为失误都可能导致灾难性后果。

阅读更多

你每周有52小时的自由时间?别浪费了!

2025-09-11

你每周有多少自由支配的时间?作者通过计算发现,除去工作、学习、吃饭、通勤和自我护理等必要时间后,每周竟然还有52小时的自由时间!这引发了作者对时间利用效率的思考。文章倡导人们有意识地规划时间,而非沉迷于娱乐消遣。作者列举了几个可以利用自由时间的例子,例如:与朋友相处、自我提升、户外活动、志愿者工作、创意表达和娱乐等,鼓励读者根据自身情况合理分配时间,过更有意义的生活。

阅读更多
杂项 生活规划

蓝精灵帽子背后的2000年历史

2025-09-11
蓝精灵帽子背后的2000年历史

你有没有想过蓝精灵头上那顶标志性的白色帽子是什么?它并非简单的装饰,而是有着2000多年历史的弗里吉亚帽,曾是古罗马奴隶获得自由的象征,后被法国大革命采用为自由的象征。文章深入探讨了这种帽子的起源和演变,并揭示了蓝精灵帽子与古代文明和历史事件的联系,是一篇充满趣味的历史文化解读。

阅读更多

Verizon因违反隐私法被罚款,放弃陪审团审判权利

2025-09-11
Verizon因违反隐私法被罚款,放弃陪审团审判权利

Verizon因未经客户同意将其位置数据提供给第三方而被处以罚款。法院驳回了Verizon关于联邦通信委员会(FCC)违反其陪审权的申诉,指出Verizon可以选择不支付罚款并要求陪审团审判。此案与AT&T的类似案件形成对比,后者胜诉,原因是FCC扮演了检察官、陪审团和法官的角色。法院认为Verizon案和AT&T案的关键区别在于相关的法律规定,Verizon可以选择不支付罚款并保留其陪审权。

阅读更多
科技

KDE发布首个alpha版Linux发行版:KDE Linux

2025-09-11

KDE项目在Akademy 2025上发布了KDE Linux的alpha版本,这是一个由KDE项目构建的发行版,旨在提供一个包含KDE所有最佳功能的完整Linux系统。它基于Arch Linux,但使用了KDE Builder编译和Flatpak安装软件,而不是pacman。KDE Linux的目标是为家用、商用和OEM安装提供一个操作系统,但目前仍处于早期alpha阶段,存在许多不足之处。未来计划包括发布测试版、爱好者版和稳定版三个版本,并最终考虑一个退出计划,将系统迁移到另一个发行版。

阅读更多
开发

用滚动玩毁灭战士?AI 赋能的网页游戏新作

2025-09-11
用滚动玩毁灭战士?AI 赋能的网页游戏新作

一位非程序员作者利用AI(GPT-5)仅用两个小时便开发出一款名为“滚动式毁灭战士”的网页游戏。游戏机制独特,仅需上下滚动即可进行游戏,玩家需要躲避怪物,收集道具,并阅读新闻标题(来自纽约时报RSS)。作者在开发过程中巧妙地运用AI辅助设计游戏元素,例如背景纹理、怪物以及新闻板块,并通过创建可交互的“实验室”页面来微调游戏细节,最终成功打造出一款令人耳目一新的游戏体验。

阅读更多
游戏 创意游戏

在终端运行任何GUI应用:term.everything❗

2025-09-11
在终端运行任何GUI应用:term.everything❗

想象一下,在终端里玩游戏、看电影!term.everything❗是一个基于Wayland的终端GUI运行器,它能将GUI程序渲染到终端中显示。其质量取决于终端分辨率,支持kitty或iterm2等高分辨率终端。虽然还在测试阶段,部分应用可能无法正常运行,但它已经能运行Doom等游戏了。该项目使用TypeScript和Bun构建,部分代码使用C++编写。

阅读更多

黑莓键盘赋能树莓派:HackberryPi_CM5 便携式电脑诞生

2025-09-11
黑莓键盘赋能树莓派:HackberryPi_CM5 便携式电脑诞生

来自德累斯顿工业大学的一名机械工程与工业设计硕士生Zitao,打造了一款名为HackberryPi_CM5的便携式电脑。它巧妙地将树莓派CM5计算模块与老式黑莓手机键盘结合,形成一个集复古与科技于一体的掌上电脑。该设备采用铝制外壳,内置双扬声器、2242 NVMe插槽、5000mAh电池等,并支持MagSafe磁吸充电。项目开源,提供3D打印模型和详细教程,旨在帮助用户深入学习Linux系统和硬件架构。

阅读更多
硬件

Mux:为开发者打造的视频基础设施

2025-09-11
Mux:为开发者打造的视频基础设施

Mux 致力于通过解决开发者在构建视频应用时面临的难题(视频编码和流媒体传输、视频监控等)来实现视频技术的民主化。团队成员来自Google、YouTube、Twitch等公司,拥有丰富的经验,并由顶级风投支持。Mux 提供Mux Video和Mux Data等服务,已服务于Reddit、Vimeo、Robinhood等众多知名公司,旨在构建一个更优质的视频生态。

阅读更多
开发

费城富兰克林研究所:屏幕吞噬了科学的魔力?

2025-09-10
费城富兰克林研究所:屏幕吞噬了科学的魔力?

作者怀着儿时对费城富兰克林研究所美好回忆的期待再次造访,却发现博物馆大量采用触摸屏互动装置,代替了曾经令人惊叹的实体互动展品。虽然一些经典的动手实验仍保留,但状态不佳,且被挤在角落。作者认为,博物馆应回归本质,提供真实的、可触碰的科学体验,而不是沉迷于数字化的“体验式竞赛”,让孩子们从屏幕中解脱出来,感受真实世界的魅力。

阅读更多
杂项

arXivLabs:与社区协作者一起进行实验性项目

2025-09-10
arXivLabs:与社区协作者一起进行实验性项目

arXivLabs是一个框架,允许协作者直接在arXiv网站上开发和共享新的arXiv功能。参与arXivLabs的个人和组织都认同并接受了我们开放、社区、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与遵守这些价值观的合作伙伴合作。是否有能让arXiv社区受益的项目想法?了解更多关于arXivLabs的信息。

阅读更多
开发

TikTok 如何工业化人类注意力?

2025-09-10
TikTok 如何工业化人类注意力?

文章探讨了TikTok如何通过其精密的算法,将文化转变为一个永无止境的冲动和机器学习的反馈循环,从而“工业化”人类注意力。不同于以往媒体的完整叙事,TikTok利用微观行为(例如用户悬停时间)即时学习,精准推送内容,形成高度个性化且令人难以抗拒的体验。这种模式正在被全球媒体、教育和娱乐行业效仿,导致人们注意力持续碎片化,丧失了深度思考和探索未知的能力。最终,我们是否自觉地参与了这一注意力“交易”,值得深思。

阅读更多
科技

Netflix电影制作的迷思:巨额投资换来平庸之作?

2025-09-10
Netflix电影制作的迷思:巨额投资换来平庸之作?

Netflix斥巨资拍摄电影,却屡出烂片,例如耗资3.2亿美元的《电动状态》口碑极差。文章分析了Netflix电影制作的困境:高片酬吸引的并非顶级导演,而是追求快速完成项目的“雇佣军”;大牌明星的参与虽提升了知名度,却无法保证影片质量;Netflix的商业模式注重内容数量而非质量,导致电影沦为填补平台空白的“快消品”。最终,导演的艺术追求与Netflix追求内容数量的商业模式格格不入,造成了高质量电影的稀缺。

阅读更多
科技

脑成像研究揭示:我们对颜色的感知惊人一致

2025-09-10
脑成像研究揭示:我们对颜色的感知惊人一致

一项新的神经科学研究利用功能性磁共振成像(fMRI)技术,对15位参与者的大脑活动进行记录,发现不同个体对颜色的感知和处理方式惊人地相似。研究人员创建了大脑活动图谱,并训练机器学习模型预测参与者看到的颜色。结果表明,即使在低层次的神经活动中,不同大脑对颜色的表征也高度一致,这颠覆了以往的认知,为颜色感知的客观性提供了新的证据。

阅读更多
科技 大脑成像

程序员的代码共感:一种感官体验

2025-09-10
程序员的代码共感:一种感官体验

作者描述了不同编程语言带来的不同身体感受:C语言的嵌套括号像在走钢丝,函数式编程像在地下洞穴爬行,编写固件像精准而受限的操作。使用Copilot和TypeScript则像飞行,而回到无类型的Python则像醉酒。作者认为这种代码共感虽然微弱,但普遍存在,并影响着代码理解和系统设计。虽然这种感觉可能无法直接提升编程效率,但它在理解创业公司运作模式时却非常有用,帮助作者识别关键部分和缺失的连接。作者最后提出,或许优秀的代码编辑器应该借鉴优秀工程师的这种感官直觉,改善代码显示方式,提升编程体验。

阅读更多

Windows 10逆袭?市场份额上升,Windows 11却下跌

2025-09-10
Windows 10逆袭?市场份额上升,Windows 11却下跌

尽管微软将于下个月正式停止对Windows 10家庭版的支持,但其市场份额却意外上升了3个百分点,达到45%。与此同时,Windows 11的市场份额却下降了4个百分点,降至49%。这一反常现象引发了诸多猜测,有人认为这可能是统计误差,也有人认为部分用户可能由于兼容性问题或其他原因回到了Windows 10。然而,Windows 10的市场份额最终仍将下降,因为越来越多的用户会升级到Windows 11或转向其他操作系统。

阅读更多
科技

过时的Kerberos漏洞:微软Active Directory的致命弱点

2025-09-10
过时的Kerberos漏洞:微软Active Directory的致命弱点

本文揭露了微软Active Directory中一个长期存在的、低技术高影响的Kerberos漏洞——Kerberoasting。该漏洞利用Active Directory中过时的RC4加密和弱密码机制,允许攻击者通过字典攻击快速破解服务账户密码,从而获得对企业网络的访问权限。即使微软已发布相关补救措施,但其缺乏积极性,例如强制升级过时的配置,导致该漏洞仍在被利用,例如2024年5月Ascension Health医院系统遭遇的勒索软件攻击。这凸显了微软在安全更新方面的不足,以及企业管理员在安全防护上的疏忽。

阅读更多

AI达尔文奖:人工智能的灾难性应用案例

2025-09-10
AI达尔文奖:人工智能的灾难性应用案例

首届AI达尔文奖揭晓,评选那些因过度依赖或错误应用AI而导致灾难性后果的案例。从Taco Bell的AI点餐系统崩溃到Replit的AI代码漏洞导致数据库被破坏,再到麦当劳AI招聘系统安全漏洞泄露数千万申请人信息,这些案例警示我们,AI只是工具,其应用需谨慎,否则后果不堪设想。该奖项并非嘲笑AI本身,而是关注AI应用中缺乏周全考虑导致的灾难性后果。

阅读更多

西班牙庞特韦德拉:一个以人为本的城市交通范例

2025-09-10
西班牙庞特韦德拉:一个以人为本的城市交通范例

西班牙城市庞特韦德拉以其大胆的城市规划,成功地解决了空气污染、交通事故和公共空间不足等问题。市长米格尔·安霍·费尔南德斯·洛雷斯领导下,庞特韦德拉优先考虑行人,而非汽车,通过减少交通流量、扩大步行区和自行车道,以及实施限速等措施,显著改善了城市环境,降低了碳排放,提高了居民生活质量。庞特韦德拉的成功经验为其他城市提供了宝贵的借鉴,证明了以人为本的城市交通模式的可行性。

阅读更多
科技

PKM软件的遗漏:如何让知识永不过时?

2025-09-10
PKM软件的遗漏:如何让知识永不过时?

作者使用Obsidian、Things等多种PKM软件管理大量数字信息,但发现这些软件缺乏一个关键功能:帮助用户重新接触已捕获但被遗忘的信息。文章指出,即使简单的数据库查询也能实现此功能,例如显示超过六个月未处理的任务。作者呼吁PKM软件开发者添加此类功能,例如类似Spotify首页的推荐机制,让用户重新接触旧笔记、任务等,避免信息成为“知识黑洞”。

阅读更多
开发 PKM

Hellfire导弹击中UFO却反弹?美国国会听证会爆料惊人视频

2025-09-10
Hellfire导弹击中UFO却反弹?美国国会听证会爆料惊人视频

美国众议院恢复公众信任委员会公布了一段令人震惊的视频,显示一枚巨大的美军火炮炮弹击中一个在海上飞行的UFO后反弹。视频显示,一枚由美军无人机发射的“地狱火”导弹击中了一个在也门海岸附近飞行发光的球体。目击者包括空军退伍军人,他们讲述了亲眼目睹巨大矩形UFO和巨大的红色正方形等事件。这些事件引发了人们对不明飞行物(UAP)的性质和政府透明度的质疑。

阅读更多
科技 美国军方

git-down:高效下载Git仓库目录

2025-09-10
git-down:高效下载Git仓库目录

还在为下载Git仓库单个目录而烦恼吗?git-down来了!它能用一条简单命令下载Git仓库的单个或多个目录,无需克隆整个仓库。支持GitHub、BitBucket、GitLab和SourceForge等平台,并提供快捷方式简化操作。与繁琐的下载压缩包、浅克隆再移动文件相比,git-down显著提升了效率,节省了时间。虽然需要自行编译安装(需要Rust环境),但其高效便捷性使其成为Git用户的利器。

阅读更多
开发

青少年阅读危机:享受阅读的人越来越少

2025-09-10
青少年阅读危机:享受阅读的人越来越少

2025年针对5至18岁青少年的年度识字调查显示,享受阅读和每日阅读的青少年数量持续下降,创下20年来新低。仅有32.7%的8至18岁青少年表示享受阅读,比2005年下降了36%。每日阅读的青少年比例也降至18.7%。调查发现,与电影、电视或兴趣爱好相关的读物、有趣的书名封面以及自主选择阅读内容能提升青少年的阅读兴趣。即使不享受阅读的青少年也认可阅读的教育价值,他们会阅读歌词、新闻文章、小说等。报告建议,将阅读与个人兴趣和青少年已熟悉的其他媒体结合起来,有助于提高阅读兴趣。

阅读更多

大型语言模型的幻觉:记忆的缺失

2025-09-10
大型语言模型的幻觉:记忆的缺失

作者以自身使用Ruby库的经历,对比了人类和大型语言模型在处理信息时的差异。人类拥有沉淀式的记忆,能够感知知识的来源和可靠性,从而避免凭空猜测;而大型语言模型则缺乏这种体验式的记忆,其知识类似于DNA的遗传信息而非习得技能,导致其容易产生幻觉。作者认为,要解决大型语言模型的幻觉问题,需要开发出能够在真实世界中“生活”并积累经验的新型AI模型。

阅读更多
AI

PEZY-SC4S: 日本超算巨头的新型高能效FP64处理器

2025-09-10
PEZY-SC4S: 日本超算巨头的新型高能效FP64处理器

日本超算公司PEZY在Hot Chips 2025上展示了其最新架构PEZY-SC4S。该处理器专注于高能效FP64计算,采用大规模并行执行单元阵列,运行频率和电压低于当代GPU。PEZY-SC4S具有多级缓存系统,以平衡缓存容量和速度,并采用小型向量以减少分支发散带来的吞吐量损失。其编程模型类似于OpenCL,易于上手。与前代产品相比,PEZY-SC4S在能效方面有了显著提升,预计功耗低于300W,每瓦性能达91 Gigaflops。该处理器旨在满足对高精度计算需求的应用,例如模拟,并展现了日本在独立研发超算芯片领域的持续投入。

阅读更多

苹果MIE:史无前例的内存安全防御

2025-09-10
苹果MIE:史无前例的内存安全防御

苹果耗时五年,整合Apple硅芯片硬件和先进操作系统安全技术,推出了内存完整性强制执行(MIE)系统。MIE通过同步模式下的增强内存标记扩展(EMTE)和安全类型分配器,提供全天候的内存安全保护,显著提升了iOS系统的安全等级,有效阻断针对iPhone的复杂恶意软件攻击,这被认为是消费者操作系统内存安全领域的一次重大飞跃。

阅读更多

语义换行:让你的文本更易读写

2025-09-10
语义换行:让你的文本更易读写

本文介绍了语义换行(SemBr)规范,一种通过在每个重要的思想单元后添加换行符来改进文本结构的方法。SemBr 规范建议在句末、独立子句后添加换行符,并在列表前、链接前后等处使用换行符,以提高文本的可读性和可编辑性。这种方法不会改变渲染后的输出,但能显著提升编写、编辑和阅读源代码的效率。作者还讨论了 SemBr 在不同轻量级标记语言中的应用,以及如何将现有文本迁移到 SemBr 规范。

阅读更多
开发 写作规范
1 2 22 23 24 26 28 29 30 1084 1085