Webtagr - 科技资讯摘要

遗传力缺口：双胞胎研究与基因组学研究的冲突

2025-06-28

20世纪70年代以来，双胞胎研究表明许多行为特征具有较高的遗传力，例如智商约60%由基因决定。然而，全基因组关联研究（GWAS）在寻找这些基因时却遇到了“遗传力缺口”问题，即GWAS只能解释一小部分遗传力。近期的研究表明，GWAS的预测能力可能被高估，部分原因是群体分层、选择性交配和基因培育等因素。此外，新的研究方法如Sib-Regression和RDR试图从更全面的角度评估遗传力，结果与双胞胎研究存在差异。目前，学界对遗传力的真实值和不同研究方法之间差异的原因存在争议，一些研究者认为双胞胎研究可能高估了遗传力，另一些则认为GWAS忽略了稀有变异和基因间的相互作用。该领域仍有许多未解之谜，需要进一步研究来解答。

(www.astralcodexten.com)

AI 遗传力

Qwen VLo：一款能理解并创造图像的AI模型

2025-06-28

阿里巴巴达摩院推出了全新多模态模型Qwen VLo，它不仅能理解图像内容，还能根据理解生成高质量图像。该模型采用渐进式生成方法，从左到右、从上到下逐步构建图像，确保最终结果一致和谐。Qwen VLo支持多种语言指令，能执行图像编辑、风格迁移等复杂任务，甚至能理解自身生成的图像内容。目前该模型仍处于预览阶段，但其强大的多模态能力展现了AI在图像生成领域的巨大潜力。

(qwenlm.github.io)

AI

强化学习：赋能2025年AI代理的崛起

2025-06-28

2023年，BabyAGI和AutoGPT等AI代理的早期尝试虽然引发轰动，却因大型语言模型（LLM）在多步骤推理方面的不足而告终。然而，2024年中期，情况发生了逆转。得益于强化学习技术的进步，新一代AI代理系统应运而生，它们能够持续完成复杂的多步骤任务，例如Bolt.new等代码生成工具和Anthropic的Claude 3.5 Sonnet。强化学习通过试错训练模型，克服了模仿学习中存在的累积误差问题，从而使模型能够在面对非训练数据时也能保持稳定性。OpenAI的RLHF和Anthropic的Constitutional AI等技术则通过自动化方式提供反馈，进一步提升了强化学习的效率。DeepSeek的R1模型则展现了模型通过强化学习“自学”推理能力的惊人潜力。总之，强化学习的进步是2025年AI代理技术腾飞的关键驱动力。

(www.understandingai.org)

AI

TarFlow：基于Transformer的归一化流模型刷新图像密度估计SOTA

2025-06-28

研究人员提出了一种名为TarFlow的新型归一化流模型，它结合了Transformer架构和掩码自回归流的优势。TarFlow通过对图像块进行自回归Transformer处理，并交替改变自回归方向，实现了高效的密度估计和图像生成。此外，研究人员还引入了三种关键技术来提升样本质量：训练过程中的高斯噪声增强、训练后的去噪过程以及有效的引导方法。实验结果表明，TarFlow在图像似然估计方面取得了显著的突破，超越了现有最佳方法，并且生成的样本质量和多样性可与扩散模型媲美，这在独立的归一化流模型中尚属首次。

(machinelearning.apple.com)

AI 归一化流

新型AI越狱攻击：回声室攻击

2025-06-27

Neural Trust的一位AI研究员发现了一种新颖的越狱技术，能够绕过当前最先进的大型语言模型（LLM）的安全机制。这种名为“回声室攻击”的方法利用上下文投毒和多轮推理，引导模型生成有害内容，而无需发出明确的危险提示。该攻击通过在多轮对话中植入看似无害的提示，逐步引导模型走向有害输出。研究表明，该攻击在多个领先模型上取得了超过90%的成功率，凸显了当前LLM安全机制的脆弱性。

(neuraltrust.ai)

AI

高智商人群更擅长预测：决策力与人生成就的关键

2025-06-27

巴斯大学管理学院的一项新研究发现，智商越高的人，预测越准确，这有助于提升决策能力和生活质量。研究显示，低智商人群（最低2.5%）的预测误差是高智商人群（最高2.5%）的两倍多。这项研究使用了英国50岁以上人群的全国代表性样本数据，评估了他们预测自身寿命的能力。研究表明，高智商人群更擅长概率评估，在预测未来不确定事件方面更为准确。该研究认为，提高人们对概率的理解，特别是针对健康和财务信息，有助于减少预测误差，做出更明智的决策。

(phys.org)

AI

TorchFT：在极端故障率下实现容错训练的LLM

2025-06-27

研究人员使用TorchFT和TorchTitan在一个真实的、具有极端合成故障率的环境中训练了一个模型，以证明容错训练的可靠性和正确性。即使在1200次故障且没有检查点的情况下，训练损失仍然保持稳定。TorchFT使用全局灯塔服务器和每个副本组管理器进行实时协调，并实现了多种容错算法，例如容错HSDP和LocalSGD/DiLoCo。实验结果表明，即使在极高的故障率下，TorchFT也能有效地进行模型训练，展现了其在应对各种故障场景下的强大能力。

(pytorch.org)

AI 容错训练 TorchFT

Gemma 3n：强大的移动端AI模型全面发布

2025-06-27

Gemma 3n，一款面向移动端的强大多模态AI模型正式发布！它基于创新的MatFormer架构，支持图像、音频、视频和文本等多种输入，并能以极低的内存占用运行（E2B仅需2GB，E4B仅需3GB）。Gemma 3n支持140种语言的文本处理和35种语言的多模态理解，并在LMArena上取得了超过1300的成绩。其高效的架构和Per-Layer Embeddings技术，使其在各种任务中表现出色，为开发者提供了前所未有的便利，并开启了移动端AI的新纪元。

(developers.googleblog.com)

AI

Meta公司AI训练数据版权纠纷：法官裁决对作者有利

2025-06-27

Meta公司因使用盗版书籍训练其AI模型Llama而面临版权诉讼。法官Chhabria认为，尽管Meta下载书籍的行为是为了进行“高度转化性”的AI训练，但这并不能免除其侵权责任。法官指出，Meta下载行为与训练Llama密不可分，且Meta可能通过提供计算能力间接支持了盗版库的运作。虽然Meta尚未被证明直接获利于盗版库，但法官认为，多数此类P2P文件共享案例都被认定为侵权。最终裁决对作者有利，取决于作者是否能提供Meta参与BitTorrent网络并因此协助盗版库的证据。

(arstechnica.com)

AI

苹果挑战扩散模型：基于Normalizing Flows的图像生成新突破

2025-06-27

苹果发布两篇论文，展示了一种被遗忘的图像生成技术——Normalizing Flows的潜力。通过结合Transformer，其新模型TarFlow和STARFlow在图像质量和效率上取得了显著进展。不同于OpenAI的GPT-4o基于离散token的生成方式，Apple的模型直接生成像素值或先压缩再解码，避免了token化带来的信息损失，并能更好地控制图像细节。STARFlow更进一步，采用潜空间生成，并整合了轻量级语言模型，使其更适用于移动设备。这标志着图像生成领域一个新的方向，挑战了扩散模型的统治地位。

(9to5mac.com)

AI Normalizing Flows

AlphaGenome：AI 解锁基因组奥秘

2025-06-27

Google DeepMind 推出 AlphaGenome，一款利用 AI 预测人类 DNA 变异对基因调控影响的工具。该模型能够处理长达百万碱基对的 DNA 序列，并预测多种分子特性，包括基因起始和终止位置、剪接位点、RNA 产量以及 DNA 碱基可及性等。AlphaGenome 在多个基准测试中取得了最先进的性能，能够高效地评估基因变异的影响，并为研究人员提供更全面的基因调控信息。目前 AlphaGenome API 已开放供非商业研究使用，有望推动基因组学和医疗保健领域的重大发现。

(deepmind.google)

AI

AI 自动编写代码：达尔文-哥德尔机器的突破

2025-06-26

微软和谷歌的CEO都曾表示AI已经参与编写了公司相当一部分代码。新的研究中，一种名为“达尔文-哥德尔机器”（DGM）的系统通过结合大型语言模型和进化算法，实现了代码编写智能体的递归式自我改进。DGM通过不断迭代和改进，在编程基准测试中取得了显著进步，其性能甚至超过了使用固定外部系统改进的智能体。虽然目前DGM的性能还无法超越人类专家，但其展现了巨大的潜力，同时也引发了关于AI安全性和潜在风险的讨论。

(spectrum.ieee.org)

AI

MUVERA：高效的多向量检索算法

2025-06-26

现代信息检索依赖于神经嵌入模型，但多向量模型虽然精度高，却因计算复杂度高而效率低下。研究人员提出了一种名为MUVERA的新算法，通过构建固定维编码(FDE)，将复杂的多向量检索转化为简单的单向量最大内积搜索(MIPS)，从而在不牺牲精度的前提下显著提高效率。该算法的开源实现已发布在GitHub上。

(research.google)

AI 多向量检索 MUVERA

Meta公司AI模型训练版权案胜诉：胜在策略而非法律

2025-06-26

Meta公司逃过了一场因其生成式AI模型Llama未经授权使用数百万本受版权保护的书籍而引发的版权诉讼。旧金山联邦法官裁定Meta的行为符合合理使用原则，但强调这更多是因为原告的诉讼策略失败。法官指出，该裁决并不意味着Meta使用受版权保护的材料训练其语言模型是合法的。

(news.bloomberglaw.com)

AI

Lovable：7个月ARR达7500万美元的AI代码生成器如何盈利？

2025-06-25

Lovable 是一款令人惊艳的AI代码生成工具，仅用 3 分钟就能完成以前需要一个月才能完成的微型应用开发。其7个月内ARR达到7500万美元的惊人增长速度，引发了人们对其盈利模式的关注。文章探讨了Lovable的价值创造方式，指出其目前基于AI信用额度的定价模式存在挑战，并提出了几种潜在的盈利策略，例如：针对机构和产品经理提供持续价值服务、推出附加组件、与其他厂商合作、建立应用商店，以及创建一个AI代理人市场。最终，文章认为Lovable的成功关键在于能否从简单的原型工具转型为一个完整的SaaS业务平台，类似于Shopify，为软件开发者提供全方位的服务和支持。

(getlago.substack.com)

AI SaaS盈利模式 Lovable

谷歌AI产品使用情况调查：Gemini和NotebookLM的日常应用

2025-06-25

一篇博文中嵌入了多次相同的调查问卷，该问卷旨在了解用户对谷歌AI工具（如Gemini和NotebookLM）的使用频率。问卷包含一个单选题，询问用户每天、每周、每月、几乎从不或不确定使用这些工具的频率。调查结果可以帮助谷歌改进其AI产品并更好地满足用户需求。

(blog.google)

AI

AI能否引领科学发现？Hugging Face首席科学家持怀疑态度

2025-06-25

Hugging Face联合创始人兼首席科学家Thomas Wolf对当前AI系统能否实现一些领先实验室所期待的科学突破表示怀疑。他认为，大型语言模型擅长回答问题，但难以提出具有原创性的问题，而这才是科学进步的关键。Wolf以围棋为例，指出AI能够掌握围棋规则，但这远不如创造围棋本身更具挑战性。他认为，目前的AI更像是在服务器上的“好好先生”，缺乏挑战现有知识框架的能力，无法提出突破性的问题。

(fortune.com)

AI

4Real-Video-V2：高效的4D视频扩散模型

2025-06-24

Snap Inc. 和 KAUST 合作推出了 4Real-Video-V2，这是一个基于前馈架构的4D视频扩散模型。它能够高效地计算视频帧的4D时空网格和每个时间步的3D高斯粒子，其关键在于一种稀疏注意力机制，该机制允许模型在同一帧、同一时间戳或同一视角的标记之间进行注意力计算。这使得它易于扩展到大型预训练视频模型，训练效率高且泛化性能好，并且在不增加基础视频模型参数的情况下实现了显著的性能提升。

(snap-research.github.io)

AI 4D视频稀疏注意力

AI模型训练版权案：法官裁定Anthropic合理使用公开书籍

2025-06-24

美国法官裁定Anthropic公司在未经作者许可的情况下使用已出版书籍训练其AI模型是合法的，这是法院首次认可AI公司关于合理使用原则可以免除其使用版权材料训练大型语言模型责任的主张。这一判决对已对OpenAI、Meta等公司提起数十起诉讼的作者、艺术家和出版商来说是一个打击。虽然该裁决不保证其他法官会效仿，但它为支持科技公司而非创意人员的先例奠定了基础。该案还涉及Anthropic从盗版网站下载数百万本受版权保护的书籍用于创建“中央图书馆”，法院将对此进行审理。

(techcrunch.com)

AI

Model Context Protocol (MCP)：LLM 的未来接口？

2025-06-24

尽管炒作不断，但模型上下文协议 (MCP) 并非魔法或革命性技术。然而，它简洁、适时且执行良好。在 Stainless，我们相信它会持续存在。MCP 解决了先前 LLM 连接世界方法的痛点：函数/工具调用繁琐、ReAct/LangChain 易出错、ChatGPT 插件受限、自定义 GPT 受限于 OpenAI 运行时等。MCP 的成功在于：1. 模型足够好，能处理复杂工作流；2. 协议足够好，提供供应商中立的共享协议；3. 工具足够好，提供易用的 SDK；4. 动力足够好，已获得主要厂商和社区支持。MCP 简化了工具和代理的开发，促进了工具复用和生态发展，有望成为 LLM 的未来接口标准。

(www.stainless.com)

AI

Anthropic的“合理使用”辩护：AI训练数据版权大战的最新进展

2025-06-24

美国加州北区法院就作家对Anthropic公司使用版权书籍训练AI模型的诉讼做出了部分判决。法院认定，Anthropic使用购买的书籍进行训练以及将纸质书转换成数字格式属于“合理使用”，但使用盗版书籍则不构成合理使用。此判决对AI行业影响深远，确认了训练AI模型使用合法获得的版权材料的合理性，但强调了获取数据途径的合法性至关重要。后续将对盗版书籍的使用进行审判，这或将对AI公司的数据获取策略产生重大影响。

(aifray.com)

AI

告别分词：大型语言模型的新纪元？

2025-06-24

本文探讨了大型语言模型中普遍存在的“分词”难题及其潜在解决方案。传统的分词方法如字节对编码（BPE）虽然有效压缩了词汇表，但同时也限制了模型的表达能力，导致各种下游问题。文章分析了多种尝试绕过分词的模型架构，例如ByT5、MambaByte、Hourglass Transformers等，并重点介绍了近期涌现的“字节潜伏变换器”（BLT）。BLT通过动态划分字节块，并结合局部编码器和全局变换器，在计算受限的环境下实现了比传统模型更好的性能和可扩展性，尤其在字符级任务上表现突出。虽然BLT仍存在一些挑战，但这项研究为大型语言模型的发展指明了新的方向，有望开启一个无需分词的新时代。

(lucalp.dev)

AI 字节潜伏变换器

大型机器人项目致谢名单：数百位贡献者齐聚一堂

2025-06-24

一个大型机器人项目发布了长长的致谢名单，数百位贡献者，包括研究人员、工程师和运营人员，为项目的成功做出了贡献。名单涵盖了来自世界各地的专家，展现了该项目背后庞大的协作网络。

(deepmind.google)

AI

AI 2027预测模型批判：过于乐观？

2025-06-23

一篇名为《AI 2027》的文章预测2027年将出现超级智能AI，引发热议。作者基于METR报告的AI发展模型，结合短期故事，预测AI将在短期内实现超人类编码能力。然而，本文作者对该模型提出了尖锐批评，指出其核心模型存在严重缺陷，包括对超指数增长曲线的过度依赖、对参数不确定性的处理不足以及对关键数据点的选择性使用。批评者认为，该模型缺乏经验验证和严谨的理论基础，其结论过于乐观且缺乏说服力，属于科技领域中一个值得警惕的案例。

(www.lesswrong.com)

AI

AI聊天机器人隐私泄露风险：法官驳回用户干预请求

2025-06-23

一起诉讼中，法官下令AI聊天机器人公司保留用户聊天记录，引发用户对隐私的担忧。用户Hunt认为该命令过于宽泛，可能导致大规模监控，并要求豁免敏感信息，如匿名聊天和涉及医疗、财务等私人信息的对话。法官驳回了Hunt的干预请求，强调该命令仅限于诉讼目的，并非大规模监控。此案突显了AI聊天机器人数据隐私的法律挑战，以及用户对数据控制权的缺乏。

(arstechnica.com)

AI

AI 广告的崛起：你的数字体验即将变糟？

2025-06-23

曾经，风投和低利率政策为初创公司提供了巨额补贴，即使它们亏本销售也在高速增长。如今，这笔钱正流向基于大型语言模型的产品，但这种补贴模式不可持续。搜索引擎和社交媒体已被广告充斥，信息质量下降，AI 发现机制也面临同样的问题。未来，AI 应用将大量引入广告，甚至可能出现“黑帽GEO”，难以区分AI 产生的虚假信息和广告。虽然付费服务和开源模型可能成为例外，但大多数消费者AI 应用都将不可避免地被广告淹没。享受现在吧，因为AI补贴时代即将结束。

(digitalseams.com)

AI

捍卫学术学科：AI时代中的知识粮仓

2025-06-21

本文反驳了“打破学科壁垒”的观点，认为学术学科如同粮仓，保护着知识的完整性和质量。作者以十九世纪粮仓的发明为例，阐述了学科的深耕细作对知识生产的重要性，并指出在AI时代，学科的专业知识是抵御AI“幻觉”和确保知识准确性的关键。AI的广度需要学科的深度来支撑，学术界内部的辩论和自我修正机制也确保了知识的持续更新，而非依赖过时或有偏见的信息。作者认为，拆除学科壁垒，只会导致知识的腐烂和匮乏。

(hollisrobbinsanecdotal.substack.com)

AI

AllTracker: 高分辨率高效密集点跟踪

2025-06-21

AllTracker是一个新型点跟踪模型，通过估计查询帧与视频中其他每一帧之间的光流场来估计长程点轨迹。它能够生成高分辨率密集（全像素）对应场，并支持768x1024像素的高分辨率跟踪。与现有方法不同，AllTracker一次处理一个窗口内的多个光流问题，而不是逐帧处理，从而实现跨越较长时间间隔的光流计算。该模型参数高效（1600万参数），并在多个数据集上进行了训练，取得了最先进的精度。

(alltracker.github.io)

AI 点跟踪光流

Weave 寻求首位 AI 工程师，助其打造工程师效率提升 AI

2025-06-21

Weave，一家由顶级投资者支持的快速发展且盈利的初创公司，正在寻找一位杰出的 AI 工程师。你将直接向 CTO 和 CEO 汇报，参与构建一个理解并提升软件工程师工作效率的 AI 系统。该公司更看重你的潜力和学习能力，而非既有技能。你需要具备顽强、务实、同理心、沟通能力和团队合作精神。熟悉 React、TypeScript、Go 或 Python 优先。你的目标是让产品能够显著提升客户的工作效率。

(www.ycombinator.com)

AI AI 工程师软件工程师效率

单剂量HIV疫苗取得突破：双佐剂组合激发强效免疫反应

2025-06-21

麻省理工学院和斯克里普斯研究所的研究人员发现，通过添加两种强大的佐剂，只需一次疫苗接种即可产生针对HIV的强效免疫反应。在小鼠实验中，这种双佐剂疫苗产生的抗体多样性远高于单佐剂疫苗或无佐剂疫苗。双佐剂疫苗在淋巴结中积聚长达一个月，使免疫系统能够产生更多针对HIV蛋白的抗体。该策略有望开发出只需注射一次的疫苗，用于包括HIV和SARS-CoV-2在内的多种传染病。

(www.sciencedaily.com)

AI HIV疫苗佐剂

分类: AI