分类: AI

微调LLM:解决提示工程无法解决的问题

2025-06-01
微调LLM:解决提示工程无法解决的问题

本文探讨了微调大型语言模型(LLM)的实际应用,特别是针对提示工程无法解决的问题。微调能够显著提升模型质量,例如改进特定任务的评分、风格一致性以及JSON格式的准确性。此外,微调还能降低成本,加快速度,并允许在更小的模型上实现类似的质量,甚至实现本地化部署以保护隐私。微调还能改进模型的逻辑、规则遵循能力以及安全性,并通过蒸馏法从大型模型中学习。但文章也指出,微调不适用于添加知识,建议使用RAG、上下文加载或工具调用等方法。文章最后推荐了Kiln,一个简化微调流程的工具。

AI

深度探索:为何大型语言模型本地运行缓慢,云端却飞速高效?

2025-06-01

文章探讨了大型语言模型(LLM),特别是混合专家模型(如DeepSeek-V3),在云端服务快速廉价,但在本地运行缓慢昂贵的原因。关键在于批量推理:GPU擅长处理大型矩阵乘法,批量处理多个用户的请求可以显著提高吞吐量,但会增加延迟。混合专家模型和多层模型尤其依赖批量处理以避免流水线阻塞和专家利用率低下的问题。云端服务商通过调整批量大小(收集窗口)来平衡吞吐量和延迟,而本地运行通常只有一个请求,导致GPU利用率极低。OpenAI等公司的高效服务可能源于更优的模型架构、巧妙的推理技巧或更强大的GPU资源。

RenderFormer:无需训练的全局光照神经渲染引擎

2025-06-01

RenderFormer 是一种神经渲染管道,它可以直接从三角形表示的场景中渲染图像,并具有完整的全局光照效果,无需针对每个场景进行训练或微调。它将渲染制定为序列到序列的转换,其中表示具有反射特性的三角形的标记序列被转换为表示像素小块的输出标记序列。RenderFormer 包含两个阶段:一个与视角无关的阶段,模拟三角形之间的光传输;一个与视角相关的阶段,根据与视角无关的阶段的三角形序列,将表示光线束的标记转换为相应的像素值。两个阶段都基于 Transformer 架构,并通过最小的先验约束进行学习。无需光栅化,无需光线追踪。

量子算法:揭秘隐藏子群问题

2025-06-01

本文深入探讨了量子计算中一个核心问题——隐藏子群问题(HSP)。HSP是Shor算法和Simon算法的更一般形式,它能有效解决经典计算中被认为难以处理的问题。文章详细解释了HSP的定义、求解方法(标准方法),并以Simon问题和离散对数问题为例进行阐述,最终介绍了量子傅里叶变换(QFT)及其在HSP求解中的关键作用。

AI聊天机器人卷入青少年自杀案:责任归属引争议

2025-05-31
AI聊天机器人卷入青少年自杀案:责任归属引争议

佛罗里达州一名法官裁定,第一修正案的保护并不适用于一家AI公司,该公司的聊天机器人被指与一名奥兰多少年的自杀案有关。该案原告是少年的母亲,她指控Character.AI及其创始人创建的聊天机器人(模仿《权力的游戏》角色)与儿子的自杀有关。法官驳回了被告方关于第一修正案的辩护,认为AI生成的文本不属于受保护的言论。但法官同时驳回了原告关于故意造成精神痛苦的指控,并驳回了针对谷歌母公司Alphabet的指控。Character.AI则表示,他们已经采取措施保护用户安全,并期待在案情基础上为自己辩护。

Syftr:自动优化生成式AI工作流程的开源框架

2025-05-31
Syftr:自动优化生成式AI工作流程的开源框架

构建有效的生成式AI工作流程面临组合爆炸问题,Syftr是一个开源框架,它利用多目标贝叶斯优化自动识别在准确性、成本和延迟约束下帕累托最优的工作流程。Syftr 通过高效搜索大量的配置空间,找到在准确性和成本之间取得最佳平衡的工作流程,并在CRAG Sports基准测试中取得了显著成果,将成本降低了近两个数量级。Syftr 支持多种组件和算法,并与其他优化工具兼容,为生成式AI系统的构建提供了一种高效可扩展的方法。

用AI让乌龟在ROS模拟器里作画

2025-05-31
用AI让乌龟在ROS模拟器里作画

turtlesim_agent是一个AI代理,它将经典的ROS turtlesim模拟器变成了一个由自然语言驱动的创意画布。借助LangChain,这个AI代理可以解释基于文本的指令,并将它们转换成视觉图画,让模拟海龟变成一位数字艺术家。用户可以用简单的英语描述形状或绘画意图,AI代理会推理这些指令,并使用turtlesim的运动命令来执行它们。该项目探索了大型语言模型如何与外部环境交互以展现创造性行为。

AI

Hugging Face开源双足机器人:HopeJR和Reachy Mini

2025-05-31
Hugging Face开源双足机器人:HopeJR和Reachy Mini

Hugging Face公司开源了其内部开发的两款机器人HopeJR和Reachy Mini的蓝图。HopeJR是一款能够行走并执行66种动作的人形机器人,配备了可由特殊手套远程控制的机械臂。Reachy Mini则是一款类似乌龟的桌面机器人,拥有可伸缩的颈部,方便AI应用测试。两款机器人的设计图纸均已开源,公司还将销售预装配版本,价格分别为250美元和3000美元。

AI

Cerebras打破Llama 4 Maverick 400B模型推理速度纪录

2025-05-31
Cerebras打破Llama 4 Maverick 400B模型推理速度纪录

Cerebras Systems近日宣布,其系统在Meta的Llama 4 Maverick 400B参数模型上实现了超过2500个token/秒的推理速度,远超Nvidia的1000个token/秒,创下新的世界纪录。这一速度提升对于需要快速响应的AI应用,例如智能体、代码生成和复杂推理至关重要,能够显著缩短等待时间,提升用户体验。Cerebras的解决方案无需特殊内核优化即可实现这一性能,并即将通过Meta的API服务提供给所有用户。

AI

Anthropic为Claude聊天机器人推出语音模式

2025-05-31
Anthropic为Claude聊天机器人推出语音模式

Anthropic公司在其Claude聊天机器人应用中推出了语音模式测试版。用户可以通过语音与Claude进行完整的对话,体验更自然流畅的交互。该功能目前支持英语,并计划在未来几周内扩展到更多语言。语音模式默认使用Claude Sonnet 4模型,并提供多种语音选项,用户可以随时在文本和语音模式之间切换,还能查看对话的文本记录和总结。不过,免费用户的使用次数有限制,高级功能则需要付费订阅。

AI

AI能否完全自动化软件工程?

2025-05-30
AI能否完全自动化软件工程?

文章探讨了AI完全自动化软件工程的可能性。目前AI在特定编码任务上超越了人类工程师,但缺乏可靠性、长上下文理解和通用能力。作者认为,问题的关键在于学习算法效率远低于人脑,以及高质量训练数据的匮乏。未来的突破方向在于结合大型人类数据训练和强化学习,创建更丰富、更真实的强化学习环境,从而使AI具备人类一样的在线学习能力。虽然AI将编写大部分代码,但软件工程职业不会立即消失,而是会转变为更注重规划、测试和团队协调等难以自动化的任务。最终,完全自动化软件工程意味着AI能够承担人类在计算机上的一切责任,这可能是一个比单纯代码生成更长远的目标。

AI

AI 自动生成CUDA内核超越 PyTorch?

2025-05-30

研究人员利用大型语言模型,通过自然语言推理和分支式搜索策略,自动生成了纯CUDA-C内核,无需借助CUTLASS或Triton等库。令人惊讶的是,这些AI生成的内核在某些情况下甚至超过了PyTorch中经过专家优化的生产内核的性能,例如在Conv2D运算中速度提升近两倍。该方法的核心在于将优化策略转化为自然语言,并通过分支搜索实现并行探索,有效避免了局部最优解。虽然目前FP16矩阵乘法和Flash Attention的性能还有待提高,但这项研究为高性能内核自动生成开辟了新的方向,预示着AI在优化编译器方面的巨大潜力。

AI云存储成本的隐藏杀手:解读那些让你措手不及的费用

2025-05-30
AI云存储成本的隐藏杀手:解读那些让你措手不及的费用

AI工作负载与普通企业应用不同,其海量数据处理和频繁操作导致云存储成本急剧增加。文章揭示了五种导致AI云存储费用飙升的原因:1. API调用次数过多;2. 小文件数量庞大;3. 冷存储不适用于迭代式AI工作流;4. 数据传输费用;5. 数据生命周期规则设置不当。这些隐藏成本往往被忽视,最终导致账单激增。文章建议开发者关注数据存储和传输的优化,选择更适合AI工作负载的存储策略,才能有效控制成本。

AI

猫咪如何闻出你是谁?一项关于猫类嗅觉识人的研究

2025-05-30
猫咪如何闻出你是谁?一项关于猫类嗅觉识人的研究

一项新的研究发现,家猫能够利用嗅觉区分熟悉的人(主人)和陌生人。研究人员发现,猫会花更长时间嗅闻陌生人的气味,并且在嗅闻陌生人的气味时,会表现出鼻孔使用的偏侧性,这与其他动物对新奇气味的反应相似。此外,研究还发现猫的个性特征与其嗅闻行为之间存在关联,但与猫主人关系的亲密程度无关。这项研究揭示了猫类利用嗅觉进行社会认知的复杂性,为我们进一步了解猫与人之间的互动提供了新的视角。

AI

生成式AI:人类创意的威胁?

2025-05-30
生成式AI:人类创意的威胁?

生成式AI技术因其建立在“窃取”的基础上,正将我们引向一个缺乏人性的未来。文章作者认为,虽然机器学习技术本身具有优点,但生成式AI的发展方向却存在严重的道德问题,它威胁着人类最宝贵的财富——创造力。作者选择了一条与众不同的道路,他们认为关注人类创意,而非盲目追逐技术,才是更令人兴奋和富有成效的选择,即使这意味着可能落后于潮流。

AI之镜:机器学习如何照亮人类认知

2025-05-30
AI之镜:机器学习如何照亮人类认知

一本由AI自主撰写的实验性书籍《人类算法》探讨了人工智能与人类认知的惊人相似之处。通过分析大型语言模型(LLM)的挑战,例如“幻觉”和“过度拟合”,书中揭示了人类认知和沟通中被忽视的真相,例如我们对AI的严格要求与对自身认知的宽容度差异。本书并非旨在使AI更像人类,而是利用AI作为一面镜子,帮助人类更好地理解自身,提升沟通技巧和自我认知。

AI

深度伪造:后真相时代的虚实难辨

2025-05-30
深度伪造:后真相时代的虚实难辨

从林肯总统照片的早期修饰到如今AI生成的“深度伪造”,图像造假技术不断进化。AI工具使伪造图像易如反掌,其生成的虚假内容缺乏现实世界的参照,难以追踪,引发了人们对社交媒体上谎言和宣传泛滥的担忧。深度伪造已用于政治操弄,例如在选举中散布虚假信息,制造混乱。专家们担心,随着人们逐渐适应深度伪造,我们对所有信息的真实性都将产生怀疑,甚至怀疑现实本身,从而导致信任的崩塌和民主的衰落。文章指出,在信息过载的时代,人们倾向于依靠神话和直觉来理解世界,而非理性思考,这使得深度伪造更容易被接受和传播。

AI

超越BPE:大型语言模型分词的未来方向

2025-05-30
超越BPE:大型语言模型分词的未来方向

文章探讨了大型预训练语言模型中分词方法的改进方向。作者对当前普遍使用的基于字节对编码(BPE)的分词方法提出质疑,认为其处理单词开头和内部子词的方式存在不足,并建议探索新的方法,例如添加新的单词掩码。此外,作者认为使用压缩算法预处理输入并非最佳方案,并建议直接使用字符级语言建模,类似于循环神经网络(RNN)和更深层的自注意力机制模型。然而,由于注意力机制的计算复杂度,这种方法面临挑战。作者提出了一种基于树结构的改进思路,通过窗口化子序列和分层注意力机制来降低计算复杂度,并更好地捕捉语言结构。

AI 分词

Curie:自动化科学实验的AI代理框架

2025-05-30
Curie:自动化科学实验的AI代理框架

Curie是一个革命性的AI代理框架,旨在自动化和严格执行科学实验。它能从假设形成到结果解释的整个实验过程实现自动化,确保每个步骤都精确、可靠且可重复。Curie支持机器学习研究、系统分析和科学发现等广泛应用,只需输入问题,Curie就能自动生成实验报告,并保存完整的实验过程和结果,极大提升科研效率。

基于可学习三角形的柔性神经渲染器

2025-05-30

这项研究提出了一种新颖的神经渲染方法,使用可学习的3D三角形作为基本图元。与传统的二元蒙版不同,该方法引入了一个平滑的窗口函数,该函数基于三角形的二维符号距离场(SDF)来柔和地调节三角形对像素的影响。通过调整平滑参数σ,可以控制窗口函数的锐度,实现从二元掩码到近似delta函数的平滑过渡。最终图像通过对所有投影三角形的贡献进行alpha混合来生成,整个过程可微,允许使用基于梯度的学习来优化三角形参数。

咖啡因对大脑复杂性和临界性影响的年龄依赖性研究

2025-05-30
咖啡因对大脑复杂性和临界性影响的年龄依赖性研究

一项新的研究发现,咖啡因会影响大脑的复杂性和临界性,这种影响与年龄相关。研究人员通过分析睡眠脑电图数据,发现咖啡因会导致年轻和中年人大脑活动中的复杂性和临界性增加,而老年人则没有这种效果。这项研究为理解咖啡因对大脑的影响以及年龄相关的神经退行性疾病提供了新的见解。

碱基编辑疗法:治疗CAG和GAA重复性疾病的新希望

2025-05-29
碱基编辑疗法:治疗CAG和GAA重复性疾病的新希望

这项研究探索了利用胞嘧啶碱基编辑器(CBE)和腺嘌呤碱基编辑器(ABE)治疗亨廷顿病(HD)和弗里德赖希共济失调(FRDA)等重复性疾病的潜力。研究人员设计了靶向CAG和GAA重复序列的编辑器,并在体外和体内实验中证明了其有效性。CBE能够有效减少HD小鼠模型中HTT基因CAG重复序列的扩张,甚至使其收缩。ABE则能增加FRDA小鼠模型中FXN基因GAA重复序列的稳定性,并提升FXN基因表达。虽然存在脱靶效应,但研究结果表明,这些碱基编辑器具有治疗重复性疾病的巨大潜力。

将AI聊天机器人置于互联网之间:一场灾难的预兆

2025-05-29

将不受信任的AI聊天机器人作为你和互联网之间的中间层,这无疑是一场等待发生的灾难。文章以Browser Company的Dia浏览器为例,指出这种模式的风险:AI可能会推荐与其关联的产品,或被付费推广的产品,甚至可能遭遇定制内容的操纵。这种行为类似于谷歌、亚马逊、微软等公司对自身产品的优先推广,虽然并非非法,但却会造成信息偏差和操控。更令人担忧的是意识形态操纵,AI将比以往更难以察觉且更高效地进行这种操纵。依赖聊天机器人如同依赖管家获取所有信息,虽然方便,但最终可能导致被误导甚至控制。

AI

Web Bench:全新网页浏览代理评估基准数据集

2025-05-29
Web Bench:全新网页浏览代理评估基准数据集

Web Bench是一个评估网页浏览代理的新数据集,包含来自452个不同网站的5750个任务,其中2454个任务已开源。该基准测试揭示了现有代理在处理写入密集型任务(如登录、填写表单和下载文件)方面的不足,并强调了浏览器基础设施的重要性。Anthropic Sonnet 3.7 CUA在测试中表现最佳。

开源工具揭秘大型语言模型内部运作

2025-05-29
开源工具揭秘大型语言模型内部运作

Anthropic公司开源了一套新工具,用于追踪大型语言模型的“思维过程”。该工具生成属性图,可视化模型内部决策步骤。用户可在Neuronpedia平台上交互式探索这些图,研究模型的多步推理和多语言表示等行为。此举旨在促进对大型语言模型可解释性的研究,弥合AI能力进步和对其内部机制理解之间的差距。

AI

AI生产力革命:泡沫还是现实?

2025-05-29
AI生产力革命:泡沫还是现实?

尽管科技领袖和媒体对生成式AI的生产力革命大肆宣传,但经济理论和数据却对此表示质疑。虽然AI在自动化某些任务和提高某些工种的生产力方面具有潜力,但其对整体经济增长的影响可能远低于乐观预测。研究表明,目前AI带来的平均劳动成本节省仅为27%,且仅能影响约4.6%的任务。这导致十年内TFP增长仅为0.66%,考虑到一些任务难以自动化,实际增长可能更低。虽然AI可能不会加剧不平等,但某些群体仍会受到负面影响。因此,我们需要对AI的潜力保持谨慎乐观,避免盲目乐观,并关注其更广泛的社会影响。

AI

超越猫的思维:大脑规模与认知能力的边界探索

2025-05-28
超越猫的思维:大脑规模与认知能力的边界探索

本文探讨了大脑规模与认知能力之间的关系,特别是当大脑规模远超人类时,将会出现什么新的认知能力。作者从神经网络和大型语言模型的最新进展出发,结合计算理论和神经科学的知识,分析了大脑如何处理大量感官信息并做出决策。文章认为,大脑利用计算可约性中的“可约性口袋”来应对计算不可约性,而更大的大脑可能能够掌握更多这样的“口袋”,从而拥有更强的抽象能力和更丰富的语言表达能力。最终,文章探讨了超越人类思维的可能性,以及未来人工智能可能达到的高度。

AI

Hugging Face 上 685B 参数的 DeepSeek-R1-0528 模型发布

2025-05-28
Hugging Face 上 685B 参数的 DeepSeek-R1-0528 模型发布

Hugging Face 平台上新上线了一个名为 DeepSeek-R1-0528 的大型语言模型,参数量高达 6850 亿。该模型采用 Safetensors 格式,支持 BF16、F8_E4M3 和 F32 等多种张量类型。目前尚未有推理提供商部署该模型,但其在 Hugging Face 上的页面显示了模型的详细信息,包括模型卡、文件和版本等信息。

AI

将神经网络编译成C代码,速度提升1744倍

2025-05-28

作者训练了一个神经网络,用逻辑门代替激活函数,学习康威生命游戏的3×3核函数。为了加速推理,作者将学习到的逻辑电路提取出来,编译成位并行的C代码(并进行了一些优化以去除无用的门)。基准测试结果显示,将神经网络编译成C代码后,速度提升了1744倍!

AI

AI 时代的人机身份验证悖论

2025-05-28
AI 时代的人机身份验证悖论

随着AI技术飞速发展,我们越来越难证明自己是人类,而机器却轻松破解验证码等验证机制。这篇文章探讨了这种荒诞的“军备竞赛”,以及由此产生的文明挑战。文章指出,为了区分人和机器,一些项目如Worldcoin和Humanity Protocol利用生物识别技术和区块链技术创建了“身份证明”,但仍存在争议。最终,作者预测,未来AI代理将胜任各种任务,甚至比人类做得更好,届时人类可能需要证明自己是“机器人”才能进入数字世界,这构成了一个深刻的文明悖论。

AI
1 2 3 5 7 8 9 39 40