Webtagr - 科技资讯摘要

算力为王：AI 发展的新范式

2025-03-23

本文探讨了AI发展的新趋势：算力至上。作者以自身经验和类比说明，过度工程化的AI系统如同精心呵护却难以适应环境变化的植物，而基于大规模算力的AI系统，如同自然生长的植物，能够自主学习和适应。通过对比基于规则、有限算力和规模化三种不同方法构建的客服自动化系统，作者论证了规模化算力方案的优越性。强化学习（RL）的兴起进一步印证了这一趋势，其通过海量计算探索多种解决方案，最终获得超越人工设计的成果。未来，AI工程师的角色将转变为构建能够有效利用海量算力的系统，而非设计完美的算法。

(ankitmaloo.com)

AI

科学家利用CRISPR技术创建可编程胚胎模型

2025-03-23

加州大学圣克鲁兹分校的科学家们利用CRISPR基因编辑技术，成功创建了无需使用真实胚胎即可模拟受精后几天胚胎发育过程的细胞模型——胚状体。该模型由小鼠干细胞组成，通过精确调控基因表达，模拟早期胚胎发育的关键阶段，为研究胚胎发育过程中的基因作用以及相关疾病的发生机制提供了新的途径。这项研究发表在《细胞干细胞》杂志上，为理解人类生育问题和改善人类生育力带来了新的希望。

(news.ucsc.edu)

AI

晚睡型与抑郁症：冥想或能成为关键桥梁

2025-03-23

一项针对年轻成年人的研究发现，晚睡型的人更容易出现抑郁症状。研究人员调查了冥想、反刍思维、酒精摄入和睡眠质量等多种因素，发现它们在晚睡型和抑郁症之间起着关键的调节作用。尤其值得注意的是，“觉察力”这一冥想要素对缓解抑郁症状具有显著的保护作用。该研究结果为改善年轻人的心理健康提供了新的干预策略。

(journals.plos.org)

AI 晚睡型

LLM如何革新推荐系统和搜索引擎？

2025-03-23

本文总结了近期将大型语言模型（LLM）应用于推荐系统和搜索引擎的最新研究。这些研究探索了多种方法，例如使用LLM增强模型架构（例如YouTube的Semantic IDs和Kuaishou的M3CSR），利用LLM生成和分析数据（例如Bing的推荐质量改进和Indeed的预期不良匹配），以及采用LLM的训练方法（例如缩放定律、迁移学习和知识蒸馏）。此外，研究还关注统一搜索和推荐系统架构，例如LinkedIn的360Brew和Netflix的UniCoRn，以提高效率和性能。总的来说，这些研究表明LLM在提升推荐系统和搜索引擎的性能方面具有巨大潜力，并取得了显著的实际效果。

(eugeneyan.com)

AI

AI经济影响：自动化劳动力而非研发？

2025-03-22

当前流行观点认为AI主要通过自动化研发来影响经济。但本文反驳了这一观点，指出研发在经济中的价值被高估，其对生产力增长的贡献远小于人们的预期。作者认为AI的经济价值将主要来自广泛的劳动力自动化，这将带来生产力和产出的显著提升，而非仅仅局限于研发领域。虽然AI最终能自动化研发，但那将发生在广泛自动化之后，届时AI已具备执行更广泛任务的能力。

(epoch.ai)

AI

AI编码的六波浪潮与程序员的未来

2025-03-22

本文探讨了AI编码的演变，从传统的代码编写到基于代码补全、基于对话、编码代理、代理集群再到代理集群，预测了未来AI编码的趋势。作者认为，编码代理将极大地提高开发效率，但同时也带来高昂的成本，并预言未来程序员的角色将转变为管理和协调AI代理。文章特别指出，年轻一代程序员比资深程序员更积极地拥抱AI技术，这将重塑软件开发行业的人才结构。

(sourcegraph.com)

AI 编码代理软件开发未来

AI偏好标准化：解决AI训练数据版权之争

2025-03-22

为解决人工智能模型训练中使用互联网内容引发的版权争议，IETF新成立的AI偏好工作组（AIPREF）致力于标准化表达内容收集和处理偏好的构建模块。目前，AI厂商使用各种非标准信号（如robots.txt）来指导爬取和训练，导致作者和出版商对其偏好的遵守缺乏信心。AIPREF将定义通用词汇表来表达作者和出版商的偏好，并制定将该词汇表附加到互联网内容上的方法，以及协调多种偏好表达的标准机制。该工作组的首个会议将于IETF 122曼谷会议期间举行。

(www.ietf.org)

AI

AI巨头押注规模化已到尽头？

2025-03-22

一项针对475名AI研究人员的调查显示，单纯依靠增加算力来实现通用人工智能（AGI）的可能性极低。尽管科技公司已投入巨资建设数据中心，但收益递减已成事实。例如，OpenAI的GPT模型最新版本改进有限，DeepSeek公司则以更低的成本和能耗实现了与西方巨头同等水平的AI模型。这表明，更廉价高效的AI方法，例如OpenAI的测试时计算和DeepSeek的“专家混合”方法，将成为未来发展方向。然而，巨头们仍倾向于继续大规模投入，而小型创业公司则在探索更经济的方案。

(futurism.com)

AI

AI 队友：一项关于生成式 AI 重塑团队合作和专业知识的实地实验

2025-03-22

一项在宝洁公司进行的随机对照试验表明，生成式 AI 可以显著提升团队工作效率和解决方案质量。实验发现，配备 AI 的个人表现与没有 AI 的团队不相上下，而配备 AI 的团队则表现最佳，产生顶级解决方案的概率更高。AI 不仅提高了工作效率，还提升了员工的积极情绪，消除了部门间的隔阂，并帮助经验不足的员工达到与经验丰富的团队成员相当的水平。这项研究表明，AI 不仅仅是提高生产力的工具，更是能够重塑团队合作和管理结构的“队友”。

(www.oneusefulthing.org)

AI

R1-Zero训练的奥秘：高效LLM对齐新框架Oat

2025-03-22

研究者们发布了一篇论文、模型和代码库，揭示了R1-Zero类训练的奥秘。他们开发了一个名为Oat的高效模块化LLM强化学习框架，并利用其对Qwen2.5等模型进行了R1-Zero训练。研究发现，合适的模型和改进的强化学习算法(Dr. GRPO)至关重要，避免了模板和问题集不匹配导致的偏差优化问题。最终，仅用27小时计算时间，在8个A100 GPU上，他们实现了最先进的性能。

(github.com)

AI R1-Zero

Meta和OpenAI涉嫌使用盗版数据库训练AI模型

2025-03-22

Meta和OpenAI被曝使用盗版书籍数据库Library Genesis (LibGen)训练其AI模型，引发版权争议。为快速训练Llama 3模型，Meta绕过昂贵的授权流程，直接下载了LibGen中数百万本书籍和论文。此举被原告作者告上法庭，庭审文件显示Meta员工知晓此举存在法律风险，并试图掩盖行为。OpenAI也承认曾使用LibGen，但声称其最新模型已不再使用该数据库。此事件凸显了AI模型训练数据来源的伦理和法律问题，以及知识产权保护的挑战。

(www.theatlantic.com)

AI 数据盗版

FutureHouse：用AI打造半自动科学家

2025-03-22

旧金山非营利组织FutureHouse正致力于利用AI自动化科学发现。他们开发了一系列以“乌鸦”命名的工具，例如ChemCrow用于化学反应设计，WikiCrow总结蛋白质信息，ContraCrow查找文献中的矛盾之处，PaperQA系列工具则用于可靠地查询PDF。 FutureHouse的目标是构建半自主的AI科学家，从预测模型到最终能够独立运行实验的类人机器人，最终加速科学发现，解决生物医学文献总结难、可靠性差等问题。他们面临的挑战包括构建基础设施、获取数据和处理工程问题，但AI模型在假设生成和结论推导方面表现出色。FutureHouse强调AI科学家的可靠性，并致力于通过改进数据分析和可重复性来解决问题。

(www.asimov.press)

AI AI科学自动化科学发现生物医学文献

腾讯HunYuan-T1：首个Mamba赋能的超大型模型，推理效率再定义

2025-03-22

腾讯发布了其HunYuan大模型系列的深度思考模型——HunYuan-T1。该模型基于全球首个超大规模混合Transformer-Mamba MoE大型模型TurboS，通过大规模后期训练，显著提升了推理能力，并更贴合人类偏好。与之前的预览版相比，HunYuan-T1在整体性能上有了显著提升，在推理速度上提升了两倍。其在多个公开基准测试中取得了与R1相当或略优的结果，并在内部人类评估数据集中展现出优势，尤其在文化创意指令遵循、文本摘要和代理能力方面。HunYuan-T1的成功，标志着强化学习在大型语言模型后训练阶段的应用取得了重大突破。

(tencent.github.io)

AI

工具型AI vs. 智能体型AI：一场关于控制与能力的博弈

2025-03-21

本文探讨了将人工智能限制为仅执行信息处理任务（工具型AI）以规避风险的方案是否有效。作者认为，这种方案由于智能体型AI在行动和推理方面都具有经济和智力优势而不可行。智能体型AI能够更好地选择数据、优化学习过程、设计自身并利用外部资源，从而获得更高的智能水平。虽然强化学习并非学习复杂事物最理想的方法，但它是控制复杂系统的最佳选择，而世界充满了我们希望控制的复杂系统，包括AI本身。因此，工具型AI最终将被智能体型AI取代，因为后者更符合市场需求和实际应用场景。

(gwern.net)

AI

Meta的Jagged Flash Attention：推荐系统性能革命

2025-03-21

Meta提出了一种名为Jagged Flash Attention的新方法，彻底改变了大型推荐系统的性能和可扩展性。传统方法处理变长类别特征（如用户交互历史）效率低下，需要填充大量零值。而Jagged Flash Attention利用Jagged张量，高效地处理这些变长特征，避免了填充带来的内存和计算开销。结合TorchRec库，该方法在Meta的生产环境中实现了高达10倍的性能提升，并支持训练拥有3万亿以上参数的模型。这项突破性技术将极大地推动个性化推荐系统的进步。

(www.shaped.ai)

AI TorchRec

ChatGPT或致孤独感增加：OpenAI与MIT联合研究

2025-03-21

OpenAI与麻省理工学院的一项联合研究表明，过度使用ChatGPT等聊天机器人可能导致孤独感增加和社交时间减少。研究发现，每天花更多时间与ChatGPT聊天的人，更容易对其产生情感依赖，并出现孤独感加重等问题。这项研究追踪了近千名用户一个月，并分析了300万用户对话，结果显示，虽然很少有人将ChatGPT用于情感交流，但情感依赖性强的人更容易因ChatGPT加剧孤独感。研究人员呼吁进一步研究人工智能对人类的影响，并强调负责任的设计的重要性。

(finance.yahoo.com)

AI 孤独感

PocketFlow：构建企业级AI系统的新框架

2025-03-21

PocketFlow是一个基于TypeScript的LLM框架，它采用嵌套有向图结构，将复杂的AI任务分解成多个可重用的LLM步骤，支持分支和递归，实现类似智能体的决策能力。该框架易于扩展，可集成多种LLM和API，无需专用包装器，并具备可视化工作流程和状态持久化的调试功能，从而加速企业级AI系统的构建。

(github.com)

AI 企业级AI

零知识证明视频详解：从理论到实践

2025-03-21

博主发布了关于零知识证明的视频，该视频深入浅出地解释了零知识证明的概念和应用，但同时也指出仅仅通过20分钟的视频难以完全理解这一复杂的算法。视频中涵盖了零知识证明的诸多方面，并推荐了更深入的学习资源。文章还详细解释了如何将可满足性问题转化为三色着色问题，并探讨了零知识证明在去中心化系统中的应用，例如无需信任权威的投票和货币交易系统。最后，文章介绍了非交互式证明的概念和实现方法，并指出通过使用密码学哈希函数可以模拟随机信标，从而实现非交互式证明。

(vasekrozhon.wordpress.com)

AI

AI生成的儿童性虐待材料：宪法第一修正案的界限

2025-03-20

一起关于使用AI生成儿童性虐待材料（CSAM）的案件引发了对美国宪法第一修正案的讨论。法院裁定，私人持有AI生成的虚拟CSAM受第一修正案保护，但制作和传播则不受保护。此案突显了在AI时代，执法部门打击儿童性剥削和虐待行为的挑战与法律界限。

(www.techpolicy.press)

AI

谷歌Gemma 3：单加速器AI模型的重大升级

2025-03-20

一年多前，谷歌发布了基于Gemini AI技术的Gemma AI模型。如今，Gemma 3强势来袭！它号称是“全球最佳单加速器模型”，在单GPU环境下超越了Llama、DeepSeek和OpenAI等竞争对手。Gemma 3支持35多种语言，可处理文本、图像和短视频，并升级了视觉编码器，支持高分辨率和非正方形图像。此外，新的ShieldGemma 2图像安全分类器可过滤色情、暴力等有害内容。尽管谷歌对“开放”模型的定义存在争议，但Gemma 3依然通过谷歌云积分和学术项目支持科研，推动AI技术发展。

(www.theverge.com)

AI Gemma 3

ChatGPT 幻觉引发的欧洲隐私诉讼：OpenAI 面临 GDPR 重罚

2025-03-20

OpenAI 的 ChatGPT 因生成虚假信息而再次面临欧洲的隐私诉讼。Noyb 组织支持一位挪威用户，ChatGPT 将其错误地描述为杀害两个孩子并企图杀害第三个孩子的凶手。这起诉讼凸显了大型语言模型“幻觉”的风险以及 GDPR 对数据准确性的要求。OpenAI 虽然提供了一些补救措施，例如阻止相关提示，但这不足以应对 GDPR 下的纠正权。此案可能导致高达公司年营业额 4% 的罚款，并迫使 OpenAI 对其 AI 产品进行修改，这将对整个 AI 行业产生深远影响。

(techcrunch.com)

AI

AI驱动云成本优化：Pump帮你节省60%云支出

2025-03-20

全球云计算支出高达5000亿美元，成为科技公司最大的增支项目。Pump公司开发了一款AI驱动平台，旨在帮助企业节省高达60%的云计算成本。该平台不仅能完全自动化节省流程，还能利用团购的力量获得更大的折扣。Pump由Y Combinator支持，团队由经验丰富的企业家组成，拥有透明、协作和快节奏的企业文化。

(www.ycombinator.com)

AI 云计算成本优化团购

Claude 3.7 Sonnet：联网搜索功能上线

2025-03-20

Anthropic的Claude AI模型现在可以通过网络搜索来获取最新的信息，从而提供更准确、及时的答案。此功能允许Claude访问最新的事件和数据，并直接引用来源以方便事实核查。付费用户（美国地区）可以立即启用此功能，免费用户及其他地区将很快支持。这项更新使得Claude能够在销售、金融分析、研究和购物等领域提供更有效的帮助，例如分析行业趋势、评估市场数据、撰写研究报告和比较产品信息等。

(www.anthropic.com)

AI 网络搜索

OpenAI发布更强大的推理AI模型o1-pro，价格却贵得惊人

2025-03-20

OpenAI在其开发者API中发布了更强大的推理AI模型o1-pro，其计算量比o1更大，旨在提供更可靠的答案。然而，o1-pro的价格极其昂贵，输入和输出成本分别是普通o1的2倍和10倍，甚至比GPT-4.5还贵。尽管OpenAI声称o1-pro在解决难题上表现更好，但早期测试结果显示其在某些任务上表现并不理想，例如解数独和理解简单的视觉笑话。内部基准测试也显示其在编码和数学问题上的表现仅略优于o1。这引发了人们对其高昂价格的质疑，OpenAI能否凭借其性能提升说服开发者买单仍有待观察。

(techcrunch.com)

AI o1-pro

深度学习课程大纲：从感知器到Transformer

2025-03-20

这份课程大纲涵盖了深度学习的方方面面，从早期的感知器和反向传播算法，到现代的卷积神经网络（CNN）、循环神经网络（RNN）和Transformer模型。课程将逐步讲解训练神经网络的技巧，包括优化算法、正则化方法等，并涉及时间序列预测、序列到序列预测以及生成对抗网络（GAN）等高级主题。整个课程将通过一系列讲座、作业和测验进行考核。

(deeplearning.cs.cmu.edu)

AI

Bolt3D：6秒生成3D场景的AI模型

2025-03-19

Google Research、VGG和Google DeepMind联合推出的Bolt3D模型，可以在单GPU上仅用6.25秒生成逼真的3D场景。该模型通过多视角扩散模型生成场景外观和几何信息，然后利用高斯头回归生成散点图像，最后将多个散点图像中的3D高斯分布组合成完整的3D场景。该模型支持单张或多张输入图像，并能够在没有重新投影或修复机制的情况下生成未观察到的场景区域。

(szymanowiczs.github.io)

AI

揭秘AI智能体：其实很简单！

2025-03-19

本文以通俗易懂的方式解释了AI智能体的内部工作原理。它将智能体系统比作一个厨房，节点如同不同的烹饪台，流程如同菜谱，共享存储如同大台面。每个节点负责准备、执行和发布结果，流程则根据决策决定下一个节点。作者用PocketFlow框架（仅100行代码）作为示例，清晰地展现了智能体如何通过决策节点、动作节点和结束节点以及它们之间的连接来完成任务，强调了其本质是简单的图结构，而非复杂的算法。

(zacharyhuang.substack.com)

AI PocketFlow 图结构

个人数字档案馆：AI 时代的独特数据宝藏

2025-03-19

作者Linda在最新一期的双周刊中探讨了个人数字档案馆的价值。她认为，在生成式AI趋向平庸化的今天，这些包含个人独特经验、偏好和视角的资料，成为训练AI模型、创造更具个性化作品的宝贵资源。文章以作者自身收集书籍、图片和链接的经历为例，并结合历史学家的观点，阐述了个人档案馆在AI时代的重要性，并列举了芬兰的一些个人档案馆案例。文章最后，作者呼吁读者分享自己收集的物品和故事，展现个人档案馆的丰富性和独特魅力。

(helloruby.substack.com)

AI 个人档案馆

Nvidia发布Isaac GR00T N1：赋能人形机器人新时代

2025-03-19

英伟达发布了其开源预训练人形机器人基础模型Isaac GR00T N1，宣告通用机器人时代到来。该模型采用双系统架构，模拟人类认知，包含快速反应的“系统1”和基于视觉语言模型进行推理规划的“系统2”。通过少量后训练数据，即可实现诸如抓取、移动物体等复杂任务。1X Technologies已成功将其部署于NEO Gamma人形机器人，实现了自主整理工作。该模型的开源性和可定制性，将极大加速人形机器人开发，推动AI领域发展。

(www.theverge.com)

AI

NVIDIA Dynamo：高吞吐量低延迟的生成式AI推理框架

2025-03-18

NVIDIA发布了Dynamo，一个用于在多节点分布式环境中为生成式AI和推理模型提供服务的、高吞吐量低延迟推理框架。Dynamo支持多种推理引擎（如TRT-LLM、vLLM、SGLang等），并具备预填充和解码推理解耦、动态GPU调度、LLM感知请求路由、加速数据传输和KV缓存卸载等特性，以最大化GPU吞吐量并降低延迟。该框架使用Rust编写以提高性能，并使用Python编写以增强可扩展性，完全开源。

(github.com)

AI

分类: AI