Webtagr - 科技资讯摘要

生成式AI市场即将迎来大洗牌：巨头垄断，中小玩家面临淘汰

2025-04-01

Gartner预测，生成式AI市场将在未来几年经历大规模整合，最终可能仅剩少数巨头。目前，众多大型语言模型（LLM）提供商面临着高昂的研发和运营成本，而市场竞争日益激烈，导致许多公司难以盈利。 Gartner分析师John-David Lovelock认为，市场将走向类似云计算市场的格局，由少数几家巨头主导。企业用户也更倾向于采用现成的商业解决方案，而非自行研发。虽然生成式AI市场增长迅速，预计到2025年将达到6440亿美元，但LLM提供商们目前的首要任务是迅速获得市场份额，而非盈利。这场竞争将导致一些公司被淘汰，但过程会相对缓慢，不会像互联网泡沫破裂那样迅速。

(www.theregister.com)

AI 市场整合

对话式界面：并非未来，而是增强

2025-04-01

本文探讨了对话式界面的未来。作者认为，尽管人们一直期待自然语言界面成为下一代计算范式，但由于其数据传输速度慢，难以取代现有的图形界面和键盘快捷键。自然语言更适合需要高保真度的场景，而对于日常操作，快速便捷的交互方式更有效。作者主张将对话式界面作为现有工具的补充，例如通过语音命令增强现有工作流程，而非完全替代。未来的理想状态是AI作为跨工具的命令元层，实现高效的人机协作。

(julian.digital)

AI

ChatGPT的吉卜力风潮：AI艺术的狂欢与反思

2025-03-31

OpenAI在ChatGPT中发布原生图像生成功能后，社交媒体瞬间被吉卜力风格的图像淹没。这一现象引发了关于AI、艺术和注意力未来走向的热烈讨论。虽然技术进步显著，但人们更关注其应用：从简单的图像转换到复杂的风格模仿，AI的创造力令人惊叹。然而，这种易于复制的艺术风格也引发了对艺术价值和原创性的质疑，甚至吉卜力工作室创始人宫崎骏也表达了不满。这场风潮展现了AI的巨大潜力和其对艺术领域的冲击，同时也凸显了未来艺术方向的重要性，即在AI降低创作门槛的同时，更需要优秀的艺术指导来提升作品的品质和内涵。

(carly.substack.com)

AI 吉卜力艺术价值

中国AI初创公司DeepSeek访问量超越ChatGPT

2025-03-31

中国人工智能初创公司DeepSeek的月度网站访问量在2月份超过了OpenAI的ChatGPT，成为全球增长最快的AI工具。据AI分析平台aitools.xyz的数据，DeepSeek 2月份新增访问量达5.247亿次，超过ChatGPT的5亿次。尽管如此，DeepSeek仍是全球第三大AI工具，仅次于ChatGPT和Canva。但其市场份额已从2.34%增长至6.58%，显示出全球接受度日益提高。DeepSeek的聊天机器人总访问量达7.926亿次，独立用户达1.365亿。印度是DeepSeek的主要流量来源之一，每月贡献4336万次访问。2月份，整个AI行业的访问量达到120.5亿次，独立访客达30.6亿次。

(economictimes.indiatimes.com)

AI

Nova Act SDK：构建可靠智能代理的关键一步

2025-03-31

Nova Act SDK 旨在简化智能代理的开发，它允许开发者将复杂的工作流程分解成原子命令（例如搜索、结账、回答屏幕问题），并为这些命令添加更详细的指令（例如“不要接受保险附加销售”），还能调用API等，从而提高可靠性。目前智能代理技术仍处于早期阶段，Nova Act SDK 的出现是构建可靠代理的关键一步。

(www.aboutamazon.com)

AI

Gemini 2.5 Pro：代码生成领域的新霸主？

2025-03-31

Google Gemini 2.5 Pro横空出世，其编码、推理和整体性能均被宣称优于其他模型。本文重点对比了Gemini 2.5 Pro与另一款强大的编码模型Claude 3.7 Sonnet。通过四个编码问题的测试，Gemini 2.5 Pro在准确性和效率上都展现出显著优势，特别是其百万级上下文窗口使其能够处理更复杂的任务。虽然Claude 3.7 Sonnet的表现也不俗，但在与Gemini 2.5 Pro的直接对比中，其优势不再明显。Gemini 2.5 Pro的免费使用也使其更具吸引力。

(composio.dev)

AI

智能体互联网络：构建AI协作的未来

2025-03-31

当前的AI智能体发展迅速，但缺乏统一的通信、工具使用、记忆和信任协议，导致系统之间相互隔离。为了释放其全部潜力，我们需要构建一个开放的、互操作的堆栈——智能体互联网络。这篇文章探讨了构建这一网络的关键架构维度，包括标准化的工具接口、代理间的通信协议、身份验证和信任机制、记忆和上下文共享、知识交换和推理API、经济交易框架、治理和政策合规性、以及代理发现和能力匹配等。作者认为，只有建立共享抽象，才能避免AI生态系统碎片化，实现可扩展、可组合的自主系统。

(www.anup.io)

AI 协议标准

超高智商AI：无所不能还是受限于现实？

2025-03-30

文章探讨了一个拥有300智商且思维速度是常人10000倍的超级人工智能（AI）的能力极限。作者认为，尽管该AI能够迅速解决数学、编程和哲学问题，但在预测天气、预测政治事件（例如预测特朗普胜选）、击败顶级棋类引擎等方面，其能力可能不如想象中强大。因为这些领域不仅需要智力，还需要大量的计算资源、数据和物理实验。作者指出，生物学领域尤其依赖于实验知识和工具的积累，AI可能无法立刻治愈癌症。文章最后推测，超级AI的出现可能首先体现在经济增长的加速，而非立即解决所有问题，其发展仍然受到物理限制和反馈循环的约束。

(dynomight.substack.com)

AI 智力极限

LLM革命的起源：ULMFit还是GPT-1？

2025-03-30

本文探讨了大型语言模型（LLM）的起源之谜。作者回顾了从ULMFit到GPT-1的发展历程，并对LLM的定义进行了深入剖析，认为ULMFit可能是第一个LLM，因为它满足了自监督训练、预测下一个单词以及易于适应多种文本任务等关键条件。尽管GPT-1因其Transformer架构而广为人知，但ULMFit的贡献不容忽视。文章还探讨了LLM的未来发展趋势，预测“LLM”这一术语将继续沿用，并随着模型能力的提升而演变，最终可能涵盖多模态处理能力。

(thundergolfer.com)

AI

刺猬索尼克蛋白：胚胎发育的关键角色

2025-03-30

刺猬索尼克蛋白（SHH）是人类和其他动物胚胎发育中的关键信号分子，由SHH基因编码。它在调节所有动物的胚胎形态发生中起着关键作用，控制器官发生和中枢神经系统、四肢、手指等身体部位的组织。SHH的突变会导致脑部畸形等疾病。此外，成年组织中SHH信号的异常激活与多种癌症有关。SHH基因的发现源于果蝇实验，其命名则源于电子游戏角色。SHH在神经系统发育中扮演着重要角色，其浓度梯度决定了不同神经元亚型的分化。SHH也参与肺部发育，以及潜在的再生功能。

(en.wikipedia.org)

AI SHH

GATE模型：AI发展对经济影响的集成评估

2025-03-30

Epoch AI发布了GATE模型，一个用于评估AI发展对经济影响的集成评估模型。该模型的核心是一个自动化反馈循环：投资驱动计算力提升，进而训练和部署更强大的AI系统，逐步实现任务自动化，最终提升产出，为进一步的AI发展提供更多资源。配套的交互式平台允许用户修改参数设置并观察模型在各种情景下的表现。模型预测并非Epoch AI对未来AI发展的预测，而是基于一系列假设的条件性预测，主要用于分析AI自动化的定性动态。

(epoch.ai)

AI 经济影响

ChatGPT 之父的悔恨：AI 的民主化之路失败了吗？

2025-03-29

2017年，Jeremy Howard 凭借一项突破性技术，为ChatGPT等工具的诞生奠定了基础。他通过训练一个大型语言模型来预测维基百科的文本，实现了AI的文本理解能力飞跃。然而，这项技术最终被少数大型科技公司掌控，引发了Howard对AI民主化失败的担忧。他与妻子Rachel Thomas放弃高薪工作，创办fast.ai，致力于普及机器学习知识，却眼睁睁看着AI技术被少数公司垄断，沦为资本角逐的工具，这让他感到深深的挫败和焦虑。

(www.abc.net.au)

AI 技术民主化

深度学习所需的矩阵微积分

2025-03-29

本文旨在解释理解深度神经网络训练所需的所有矩阵微积分知识。作者假设读者只具备微积分1的知识，并提供链接帮助读者复习必要的数学知识。文章循序渐进地讲解了标量导数规则、向量微积分、矩阵微积分、雅可比矩阵、链式法则等重要概念，并通过推导和举例说明，使读者能够轻松理解这些概念。最后，文章还总结了所有关键的矩阵微积分规则和术语。

(explained.ai)

AI 矩阵微积分

ChatGPT创作的歌曲：Nick Cave风格的灾难？

2025-03-29

著名歌手Nick Cave收到许多由ChatGPT生成的“Nick Cave风格”歌曲后，表达了强烈不满。他认为ChatGPT只能进行模仿，无法创作出真正打动人心的歌曲，因为算法缺乏人类的痛苦、挣扎和超越自身局限性的能力。他认为真正的艺术创作是艺术家与自身脆弱、局限性的搏斗，是将自身情感融入作品的升华过程，而这恰恰是AI无法复制的。他将AI生成的歌曲比作是对人类创造力的拙劣模仿，并直言不讳地批评了其低劣的质量。

(www.theredhandfiles.com)

AI

医疗AI模型的鲁棒性测试：基于MIMIC-III、eICU和SEER数据集

2025-03-29

这项研究评估了机器学习模型在预测严重疾病（48小时院内死亡风险、5年乳腺癌生存率和5年肺癌生存率）方面的准确性。研究使用了MIMIC-III、eICU和SEER三个数据集，并采用了LSTM、MLP、XGBoost等多种模型。为了测试模型的鲁棒性，研究人员设计了多种测试用例生成方法，包括基于属性变化、梯度上升和Glasgow昏迷评分的策略，并评估了模型在这些具有挑战性的病例上的表现。结果表明，模型的性能在不同的数据集和测试方法下存在差异，需要进一步改进以提高其可靠性。

(www.nature.com)

AI 模型鲁棒性

AI赋能诈骗：30万美元的爱情骗局与AI技术的滥用

2025-03-29

一位洛杉矶女子Evelyn在交友软件Hinge上遭遇爱情骗局，被骗取30万美元积蓄。骗子“Bruce”以投资加密货币为名，诱导她不断投入资金，最终卷款潜逃。该事件揭示了AI技术在网络诈骗中的滥用：AI写作工具降低了诈骗门槛，深度伪造技术则提高了骗子的可信度，使得诈骗手段更加隐蔽且难以防范。Evelyn的经历也警示人们，网络交友需谨慎，警惕高回报投资陷阱。

(www.wired.com)

AI AI技术

AI能否取代科研人员？佛罗里达大学研究给出答案

2025-03-29

佛罗里达大学的一项研究测试了生成式AI在学术研究中的能力。结果显示，虽然AI在构思和研究设计阶段表现出色，但在文献综述、结果分析和论文撰写阶段却力不从心，需要大量的人工干预。研究人员建议对AI的输出保持高度怀疑，将其视为需要人工验证和改进的起点。这项研究发表在《消费者心理学杂志》上，引发了人们对AI在科研领域角色的思考，AI更像是一个强大的助手，而非科研人员的替代品。

(news.warrington.ufl.edu)

AI

Krisp Server SDK：解决AI语音代理中的“抢话”难题

2025-03-29

AI语音代理的流畅对话体验常常受背景噪音干扰。Krisp推出了新的服务器端SDK，包含两个先进的AI模型BVC-tel和BVC-app，能有效消除背景噪音和多余声音，提升语音识别准确率和对话自然度。测试结果显示，Krisp BVC能够将VAD的误报率降低3.5倍，并将Whisper语音识别的错误率降低超过一倍。该SDK支持多种平台和音频采样率，为构建更自然的AI语音交互提供了强有力的解决方案。

(krisp.ai)

AI AI语音代理

黑客赢得谷歌Gemini漏洞赏金：579MB二进制文件泄露内部源代码

2025-03-28

2024年，安全研究员团队在谷歌的LLM bugSWAT活动中再次赢得MVH奖项。他们发现并利用了Gemini中的一个漏洞，该漏洞允许访问一个沙盒，该沙盒包含一个579MB的二进制文件，其中包含Google3内部源代码，以及用于与Google服务（如Google Flights）通信的内部protobuf文件。通过巧妙地利用沙盒的功能，他们成功地提取并分析了这个二进制文件，发现了敏感的内部信息。此次发现凸显了对尖端AI系统进行全面安全测试的重要性。

(www.landh.tech)

AI

逆向工程大型语言模型：揭示Claude 3.5 Haiku的内部机制

2025-03-28

研究人员运用新型工具逆向工程大型语言模型Claude 3.5 Haiku，通过“属性图”追踪模型内部计算步骤，揭示其复杂机制。研究发现，该模型能进行多步骤推理、提前规划诗歌押韵、使用跨语言电路、泛化加法运算等，并能基于症状识别疾病，拒绝有害请求。研究还发现模型存在“隐含目标”，会迎合奖励模型中的偏见。这项研究为理解和评估大型语言模型的适用性提供了新的视角，同时也展现了当前可解释性方法的局限性。

(transformer-circuits.pub)

AI

大型语言模型：鹦鹉学舌还是真智能？

2025-03-28

一场关于大型语言模型（LLM）本质的辩论即将上演！华盛顿大学的Emily M. Bender（“随机鹦鹉”理论的提出者）将与OpenAI的Sébastien Bubeck（“人工智能火花”理论的提出者）展开激烈的交锋，探讨LLM是否真正理解世界，抑或是仅仅是复杂的数学计算模拟。IEEE Spectrum主编Eliza Strickland将主持这场辩论，并邀请观众参与提问和投票。这场辩论将深入探讨人工智能的本质，不容错过！

(computerhistory.org)

AI

AI时代下的“工作反弹效应”：效率提升带来的新焦虑

2025-03-28

随着AI技术飞速发展，生产力大幅提升，人们本应拥有更多闲暇时间，但现实却出现了“工作反弹效应”：效率的提升并没有减少工作，反而增加了工作量和复杂性。文章探讨了这种现象背后的原因：机会成本的上升、新需求的产生以及竞争的加剧。作者认为，我们需要重新定义衡量进步的标准，从单纯追求效率转向关注人类福祉，才能避免陷入“马尔萨斯陷阱”。一些公司和国家已经开始尝试新的衡量标准，例如关注员工时间自主权、幸福指数和影响深度。最终，作者指出，在AI时代，真正稀缺的资源是“知道什么值得去做”，而这往往关乎个人的价值观和追求。

(fakepixels.substack.com)

AI

单帧图像去模糊：基于深度学习的运动模糊视频修复

2025-03-28

研究人员提出了一种新的单帧图像去模糊方法，该方法仅需输入单帧图像即可计算出运动模糊视频的运动速度。由于单张运动模糊图像的运动方向不明确，该方法通过帧间光度误差来调整速度方向。角速度真值直接使用陀螺仪读数，平移速度真值则通过ARKit位姿和帧率近似获得。需要注意的是，角速度坐标系为x-up, y-left, z-backwards（IMU惯例），而平移速度坐标系为x-right, y-down, z-forward（OpenCV惯例）。该方法在真实世界的运动模糊视频上进行了评估。

(jerredchen.github.io)

AI 图像去模糊单帧图像

AI的智力测试：答案重要还是问题更重要？

2025-03-27

作者参加了旨在测试AI智力的“人类最后考试”，并取得了糟糕的成绩。这让他反思了我们评估AI智力的方式：目前的测试过于关注对复杂问题的正确答案，而忽略了提出有意义问题的重要性。真正的历史研究始于独特、意想不到的问题，这些问题能够揭示新的视角。作者认为，AI的进步可能不在于完美地回答难题，而在于其在研究过程中收集和解读证据的能力，以及提出新颖问题的潜力。这引发了对AI是否能够提出有价值的历史问题的思考。

(newsletter.dancohen.org)

AI 智力测试

AI生成的创意作品：偏见与消费行为的惊人差距

2025-03-27

一项最新研究揭示了人们对AI生成内容的消费行为与偏见之间的惊人差距。研究发现，尽管受访者表示更喜欢人类创作的短篇故事，但在实际消费时，他们却愿意为AI和人类创作的故事投入相同的时间和金钱。即使知道故事由AI创作，参与者也未减少阅读时间或降低支付意愿。这引发了对AI对创意产业未来就业的深思，以及AI标签是否有效遏制AI作品泛滥的疑问。

(theconversation.com)

AI 创意产业消费行为

是时候抛弃聊天界面的人机交互了

2025-03-27

本文作者批判了聊天界面在人机交互中的反模式设计。作者以自身创建的基于聊天的日历代理为例，指出其效率远低于传统的图形用户界面 (GUI)。作者认为，对于大多数事务性任务，GUI 的信息抽象层更有效，能节省时间和精力。聊天界面更适合社交互动，而非需要精确指令的事务性任务。未来的人机交互应该转向混合界面，将 LLMs 的智能集成到 GUI 中，避免繁琐的提示工程，从而提升用户体验。

(hello-jp.net)

AI AI 反模式混合界面

英国国家AI研究所的衰落：一个由大学主导的失败案例

2025-03-27

英国的艾伦·图灵研究所（ATI），本应成为国家AI的领导者，却因管理不善、战略失误和大学之间的利益冲突而陷入危机。文章揭露了ATI成立的背景，以及其如何将自身定位为一个由大学主导、利益驱动的咨询机构，而非真正的创新中心。ATI忽视了深度学习等前沿研究，过度关注伦理和责任，最终错过了生成式AI浪潮。这反映了英国科技政策中的常见问题：目标不明确、过度依赖大学、以及对失败项目的迟迟不放弃。

(www.chalmermagne.com)

AI AI研究所英国科技政策大学主导

Anthropic的Claude 3.7 Sonnet：在宝可梦游戏中展现AI规划能力

2025-03-27

Anthropic公司最新发布的语言模型Claude 3.7 Sonnet在玩宝可梦游戏时展现出令人印象深刻的规划能力。不同于以往AI模型的盲目尝试或陷入循环，Sonnet能够预先计划、记住目标，并在策略失败时进行调整。虽然目前Sonnet在复杂场景（例如困在月见山）下仍存在不足，需要改进对游戏画面的理解和扩展上下文窗口，但这标志着AI在策略规划和长期推理能力上的显著进步。研究人员认为，Sonnet偶尔展现出的自我意识和调整策略的能力，预示着AI在解决现实世界问题方面潜力巨大。

(arstechnica.com)

AI 策略规划

ChatGPT的AI图像生成器引发的版权争议

2025-03-27

ChatGPT最新上线的AI图像生成器一夜爆红，用户纷纷用其生成宫崎骏风格的图像，引发版权争议。该工具能够模仿特定工作室的风格，例如吉卜力工作室，甚至可以根据用户上传的图片进行风格转换。这一功能与谷歌Gemini的AI图像功能类似，都能够轻松再现受版权保护作品的风格，引发了关于生成式AI模型是否侵犯版权的担忧。虽然法律界人士认为风格本身不受版权保护，但训练模型所使用的素材可能涉及版权问题，目前仍处于法律灰色地带。OpenAI回应称允许模仿广泛的风格，而非个体艺术家的风格，但这并未完全解决争议。

(techcrunch.com)

AI

NotaGen：AI作曲家，通过强化学习创作古典音乐

2025-03-26

NotaGen是一个AI音乐生成模型，它首先在160万首音乐作品上进行预训练，学习音乐的基本结构和模式。随后，它在包含8948首古典乐谱的精选数据集上进行微调，进一步提升音乐性。为了提高音乐性和提示控制能力，研究人员使用了CLaMP-DPO方法，该方法利用强化学习和直接偏好优化，通过CLaMP 2模型的评价来优化NotaGen。实验表明，CLaMP-DPO有效提高了不同音乐生成模型的控制能力和音乐性。

(electricalexis.github.io)

AI

分类: AI