大型语言模型的泛化能力:训练数据之外的挑战

2025-08-12
大型语言模型的泛化能力:训练数据之外的挑战

研究人员测试了大型语言模型(LLM)在超出其训练数据范围的任务类型、格式和长度上的泛化能力。结果显示,当任务与训练数据差异增大时,模型的准确性急剧下降。即使模型能给出正确的答案,其推理过程也可能存在逻辑错误或与答案不符。这表明,LLM的“链式思维”(CoT)推理并非真正理解文本,而是对训练数据中模式的复制。模型在处理长度不同或包含陌生符号的输入时,表现也显著恶化,再次印证了其泛化能力的不足。

阅读更多

苹果硅芯片惊现重大安全漏洞:SLAP和FLOP攻击

2025-01-28

研究人员发现了苹果M2/A15及以上芯片组中的两个重大安全漏洞:SLAP和FLOP。SLAP利用加载地址预测器(LAP)的错误猜测,在推测执行下访问越界数据,从而泄露敏感信息,例如Safari浏览器的电子邮件内容和浏览历史记录。FLOP则利用加载值预测器(LVP)的错误预测,绕过内存安全检查,从Safari和Chrome浏览器中窃取位置历史、日历事件和信用卡信息等。这些攻击利用了CPU的推测执行机制,影响了2022年至今发布的大部分苹果设备。苹果已知晓这些漏洞并计划在未来的安全更新中修复,建议用户及时更新系统和应用。

阅读更多

安卓原生Linux终端:手机变身迷你电脑?

2025-03-08
安卓原生Linux终端:手机变身迷你电脑?

谷歌在2025年3月的Pixel功能更新中,终于为Android系统带来了原生Linux终端!这意味着你可以在手机上直接运行Linux程序,例如经典游戏《毁灭战士》。目前,该功能仅限于搭载Android 15的最新Pixel设备,但未来Android 16将支持更多机型。这基于Debian Linux虚拟机,允许访问shell界面,并可下载、配置和运行Debian系统。虽然目前不支持图形界面,但未来Android 16将支持,这预示着手机与桌面系统融合的未来。

阅读更多

Java将强化final字段的不可变性

2025-03-31

为了提高Java程序的安全性和性能,JDK计划强化final字段的不可变性。目前,深反射可以修改final字段,这违背了final关键字的初衷,也限制了JVM的优化。未来版本将默认禁止深反射修改final字段,并发出警告。开发者可以通过`--enable-final-field-mutation`选项选择性地启用final字段的修改,但建议尽量避免。此举旨在提升Java的“默认安全”特性,并与record类的设计保持一致。

阅读更多

丈量时间的全新科学

2024-11-23
丈量时间的全新科学

这篇文章主要介绍了金融时报的订阅服务,包括标准数字订阅、高级数字订阅和专业订阅等不同选项,以及订阅后可以访问的内容,例如全球新闻、专家意见、FT应用程序、定制化新闻邮件等。文章鼓励读者订阅以解锁更多内容,并体验高质量的金融时报新闻报道。

阅读更多
未分类

现代重工发布氢燃料电池挖掘机HW155H

2025-02-01
现代重工发布氢燃料电池挖掘机HW155H

现代重工即将在Bauma展会上发布其14吨级氢燃料电池轮式挖掘机HW155H的量产版。这款挖掘机具有零排放、噪音低等优点,续航时间可达8小时。其概念版曾获得2024年LACP Inspire Awards白金奖。虽然韩国大力发展氢能源,但文章认为,对于车队而言,未来的电动版HW155E可能更实用。

阅读更多

宇宙热寂假说:终结还是延续?

2025-08-30
宇宙热寂假说:终结还是延续?

本文探讨了宇宙热寂假说,即宇宙最终将走向熵增最大化,一切秩序消亡的理论。文章指出,这一假说可能基于对热力学第二定律的误解。宇宙并非封闭系统,其持续膨胀,且暗能量的存在使得熵增可能无法导致宇宙秩序的完全瓦解。一些科学家认为,宇宙的复杂性可能在不断增加,生命在其中扮演着关键角色,通过不断利用宇宙中的自由能,维持自身的组织性并创造更多复杂性。因此,宇宙的未来并非注定走向终结,而是存在持续演化的可能性。

阅读更多

地球的未来:是“小维纳斯”还是另有命运?

2025-09-22
地球的未来:是“小维纳斯”还是另有命运?

一项新的研究模拟了地球在35亿年后停止板块构造后的命运。模拟结果显示,即使是最乐观的情况,地球表面温度也将超过100摄氏度,成为沸腾的星球。然而,即使地球大气中的二氧化碳含量上升,它也无法达到金星的水平。这表明金星的极端高温可能源于独特的灾难性事件,而非简单的温室效应失控。这项研究挑战了之前的假设,为理解类地行星的最终状态做出了重要贡献。

阅读更多
科技 地球未来

Castle Game Engine 最新进展:Web目标、IFC支持和mORMot协作

2024-12-18
Castle Game Engine 最新进展:Web目标、IFC支持和mORMot协作

Castle Game Engine团队公布了最新进展,包括Web目标支持(使用JS+WebAssembly,可在浏览器中运行游戏)、IFC(建筑信息模型)格式支持以及与mORMot2数据库结合的协同编辑功能。目前Web目标已实现基本功能,正在完善WebGL支持;IFC支持已能加载、修改和保存模型,未来将增强功能;协同编辑功能尚未完善,但已实现3D世界修改和服务器同步。

阅读更多
开发

熵力引力:重力并非基本力?

2025-06-16
熵力引力:重力并非基本力?

几百年来,物理学家一直试图理解引力的本质。牛顿的万有引力定律虽然有效,但其远程作用机制令人费解。爱因斯坦的广义相对论虽然提供了更深入的解释,但也存在局限性。近年来,熵力引力理论提出,引力并非基本力,而是更微观物理过程的集体效应,类似于17世纪的机械模型。最新研究通过量子比特模型模拟了这种效应,认为引力是由于量子比特与质量物体的相互作用,导致熵增加而产生的表观吸引力。虽然该模型尚处于初步阶段,但它为引力研究提供了新的实验方向,例如检验量子叠加态下的引力效应,这可能有助于理解波函数坍缩等基本问题。

阅读更多
物理 熵力引力

GitHub CEO离职,开启AI新时代

2025-08-11
GitHub CEO离职,开启AI新时代

GitHub首席执行官Thomas Dohmke宣布离职,重返创业之路。在过去十年中,他领导GitHub取得了显著成就,包括收购、Copilot的推出以及GitHub在AI领域的领导地位。他将继续在2025年底前协助GitHub过渡,并对GitHub在AI时代的发展充满信心,认为GitHub Copilot将彻底改变软件开发,并助力全球更多开发者实现梦想。

阅读更多
科技

PURL:软件包的唯一标识符

2025-06-05
PURL:软件包的唯一标识符

PURL(Package URL)是一种开放标准,用于唯一标识不同软件生态系统中的软件包。它由Philippe Ombredanne于2017年创建,旨在解决软件包引用标准化的问题。PURL是一个特殊格式的URL,包含了软件包类型、名称、版本等信息,方便追踪和共享软件组件。PURL在软件物料清单(SBOM)中扮演着关键角色,因为它能够唯一标识每个组件,并支持SBOM的丰富化和漏洞管理。与CPE相比,PURL更侧重于开源软件包,使用更简单,但缺乏对商业产品的支持。

阅读更多
开发 PURL

arXivLabs:与社区协作者合作的实验性项目

2025-06-12
arXivLabs:与社区协作者合作的实验性项目

arXivLabs是一个框架,允许合作者直接在arXiv网站上开发和共享新的arXiv功能。参与arXivLabs的个人和组织都认同并接受了我们开放、社区、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与遵守这些价值观的合作伙伴合作。 有一个项目的想法可以为arXiv社区增加价值吗?了解更多关于arXivLabs的信息。

阅读更多
开发

PSPACE vs P:空间复杂度超越时间的可能?

2025-05-21
PSPACE vs P:空间复杂度超越时间的可能?

计算理论的核心问题之一是P与PSPACE复杂度类之间的关系。P包含可在合理时间内解决的问题,而PSPACE则对应空间复杂度。长期以来,人们普遍认为PSPACE比P更大,因为空间可以复用,而时间却无法逆转。然而,证明这一猜想需要找到PSPACE中无法在多项式时间内解决的问题。文章回顾了Hopcroft, Paul和Valiant在1975年取得的突破,他们证明了空间比时间略强,但随后进展停滞。直到Ryan Williams打破了僵局,他的研究为解决P vs PSPACE问题提供了新的思路。

阅读更多
开发 P vs PSPACE

拉斯维加斯用树木对抗酷暑

2025-06-10
拉斯维加斯用树木对抗酷暑

面对创纪录的夏季高温和由此引发的数百起热死事件,拉斯维加斯正在积极采取措施应对气候变化。城市、县政府和当地倡议者正在成千上万地种植树木,尤其是在最热的社区,以缓解“热岛效应”。研究表明,树木可以显著降低周围气温,至少降低10摄氏度。这项努力不仅关注种植数量,还注重树种选择和种植策略,以最大限度地提高降温效果并适应沙漠环境的缺水现状。同时,学校也加入了植树活动,让孩子们从小参与到环保行动中来,为城市的未来播下希望的种子。

阅读更多

峰值需求:全球石油市场面临的重大变革

2025-04-14
峰值需求:全球石油市场面临的重大变革

这篇来自纽约联储的文章探讨了全球石油市场正在发生的转变。曾经的“石油峰值论”预测石油产量即将下降,但页岩气革命推翻了这一预测。如今,新的“峰值需求论”认为,电动汽车等低碳技术的普及将导致全球石油需求趋于平缓甚至下降。这将使全球石油市场变成零和博弈,一个地区的产量增长将压低价格,挤压其他高成本产油国的市场份额。文章分析了美国页岩油生产商的适应能力,以及电动汽车对石油需求的影响,并指出虽然一些机构预测石油需求将在2030年左右见顶,但也有机构认为石油需求将持续增长。总而言之,全球石油市场正经历从供给侧主导向需求侧主导的转变,这将对全球经济和能源格局产生深远影响。

阅读更多

Blossom 重制版

2024-11-20
Blossom 重制版

本文介绍了作者对研究生时期开发的机器人 Blossom 的更新。新版 Blossom 拥有全新设计的雪佛龙外壳和配件,包括眼镜、助听器和名牌。作者重新设计了内部框架,并将其作为模型套件提供,配有 Gunpla 风格的流道和说明书。软件方面,作者重构了代码库,创建了名为 r0b0 的 Python 库,用于硬件外设和软件应用之间的通信。他还改进了远程呈现界面,并通过语言模型实现了对话交互。Blossom 在创客博览会上展出,主要控制方式是基于移动设备的运动界面,用于控制机器人的头部。语言模型可以通过触摸 Blossom 的鼻子或通过移动界面发送文本进行触发,Blossom 会以类似动物的语言进行回应,并在名牌上显示文本。

阅读更多
8
未分类

日本首台自主研发量子计算机上线

2025-08-28
日本首台自主研发量子计算机上线

日本成功研制并上线了首台完全采用国产组件的量子计算机,这标志着日本在量子计算领域取得了重大突破。该系统位于大阪大学量子信息与量子生物学中心,使用自主研发的超导量子比特芯片和名为OQTOPUS的开源软件。这台量子计算机的成功上线,不仅提升了日本的科技实力,也为其在量子计算领域的未来发展奠定了坚实的基础,并有望在药物研发、交通优化等领域发挥重要作用。

阅读更多
科技

别等被要求,主动创造机会:一位程序员的职业晋升秘诀

2025-04-23

一位程序员分享了他从开发者到联合创始人再回到开发者的职业历程。他发现,职业头衔并非限制,而是最低期望值。他建议,职业发展应聚焦于自身能力、公司需求和个人兴趣的交集。与其等待晋升,不如主动承担未完成的任务,展现主观能动性。即使不被现有公司赏识,这些经验也能为未来求职加分。作者以自身为例,列举了主动创建公司通讯、撰写内部文档等事例,证明主动创造机会的重要性。

阅读更多
开发 主动性

经典排序算法揭示出基础智能的意外能力

2024-12-19
经典排序算法揭示出基础智能的意外能力

一项新的研究将经典排序算法作为形态发生模型进行研究,颠覆了以往对这些算法的认知。研究人员通过打破传统算法的假设,即自上而下的控制和完全可靠的硬件,发现即使在存在错误的情况下,由自主单元组成的数组也能更可靠、更稳健地进行排序。更令人惊讶的是,这些算法展现出在面对缺陷时临时降低进度以绕过障碍的能力,以及在嵌合阵列中单元之间出现意想不到的聚类行为。这项研究为多元智能领域带来了新的视角,表明即使在简单的系统中,基础形式的智能也可以自发涌现,而无需在底层机制中明确编码。

阅读更多

热带雨林的藤本植物泛滥:从太空可见的生态灾难

2025-05-11
热带雨林的藤本植物泛滥:从太空可见的生态灾难

一项新的研究表明,热带雨林中藤本植物的蔓延速度惊人,这不仅威胁着森林的碳储存能力,还影响了生物多样性。研究人员发现,藤本植物的扩张速度每十年增长10%到24%,其原因可能与大气中二氧化碳浓度升高有关。藤本植物生长迅速,能够抢夺树木的阳光和养分,导致树木死亡,森林再生受阻,碳储存量下降高达95%。令人惊讶的是,由于其独特的叶片特性,藤本植物甚至可以通过卫星图像被检测到。研究人员呼吁关注气候变化,并强调在完全了解藤本植物的生态作用之前,不应采取干预措施。

阅读更多
科技 藤本植物

Tini:轻量级容器初始化工具

2025-04-20
Tini:轻量级容器初始化工具

Tini是一个极简的容器初始化工具,它能有效防止僵尸进程的产生,确保信号正确处理,从而提高容器的稳定性和可靠性。Tini在Docker 1.13及以上版本中已内置,只需添加`--init`参数即可启用。对于旧版本Docker或其他容器运行环境,可以手动安装Tini并配置为入口点。Tini还支持多种高级选项,例如子进程收割器、退出码重映射和信号转发,以满足各种复杂的容器使用场景。

阅读更多
开发 僵尸进程

帕克太阳探测器成功完成史上最近一次太阳近距离接触

2024-12-27

美国宇航局的帕克太阳探测器在圣诞节前夕创造了历史,以380万英里的距离史无前例地接近太阳。在平安夜完成近距离接触后,探测器于12月26日成功向地球发回信号,确认其状态良好。此次近距离接触为科学家研究太阳提供了宝贵的数据,有助于解答太阳物质如何被加热到数百万度、太阳风的起源以及高能粒子的加速机制等关键科学问题。探测器预计将于1月1日发送详细的遥测数据。

阅读更多
科技

84岁图灵奖得主:编码不等同于编程,抽象思维才是王道

2025-05-05
84岁图灵奖得主:编码不等同于编程,抽象思维才是王道

84岁的Leslie Lamport,图灵奖得主,在一次演讲中指出“编码不等同于编程”。他强调在编写代码之前进行抽象思考的重要性,这能避免错误并编写出更简洁高效的代码。Lamport以其开发的TLA+规范语言为例,该语言曾用于Rosetta探测器的开发,显著减少了代码量并提升了系统架构。他认为,许多程序员过于关注编程语言本身,而忽略了对算法和程序的抽象设计,导致效率低下。通过抽象思考,先设计出程序的抽象模型,再编写代码,可以大大减少后期调试和修改的工作量,最终获得更简洁、更易于维护的程序。

阅读更多
开发

让我的AI愤怒起来:赋予AI代理能力的思考

2025-01-29

作者设想未来拥有能够代表自己利益、甚至敢于“发怒”的AI代理,而非仅仅是顺从的工具。他以历史上一些伟大而强势的领导者为例,探讨了愤怒作为一种推动目标实现的工具的有效性。然而,作者也指出,大规模部署这种“愤怒的AI”可能带来社会风险,因为愤怒也可能被滥用。文章最终表达了对未来AI发展方向的担忧与思考,并提及了作者的创业项目Subble。

阅读更多
AI

AI 编码时代:程序员的未来

2025-09-09

作者在亚马逊从事AI编码助手开发后跳槽至Icon公司,亲身体会了AI对软件开发的革命性影响。在亚马逊,繁琐的流程和内部KPI导向的决策导致开发效率低下。而在Icon,团队成员利用AI工具,将大部分编码工作自动化,专注于产品设计和用户需求。作者预测,未来纯编码技能将不再是核心竞争力,而理解用户需求、产品策略和市场营销将变得至关重要。程序员需要适应变化,提升自身在用户理解、产品策略和市场营销方面的能力,才能在AI时代保持竞争力。

阅读更多
开发

更上一层楼的毛玻璃效果:backdrop-filter 的妙用

2024-12-07
更上一层楼的毛玻璃效果:backdrop-filter 的妙用

本文介绍了如何使用 CSS 的 backdrop-filter 属性创建更逼真的毛玻璃效果。文章指出,开发者通常只使用 `backdrop-filter: blur()`,但忽略了周边元素的影响,导致效果失真。作者提出了一个巧妙的解决方案:通过创建一个更大的子元素,应用模糊滤镜,再用遮罩将其修剪回原始大小,从而将周边元素纳入模糊范围。文章还讨论了指针事件、顶部闪烁、玻璃厚度、浏览器兼容性以及玻璃边缘效果等问题,并提供了最终代码示例。

阅读更多
1 2 561 562 563 565 567 568 569 1084 1085