革命性技术:内存成本降低高达75%!
日本初创公司Sakana AI研发了一种名为“通用Transformer内存”的新技术,通过特殊的“神经注意力记忆模块”(NAMM),可有效优化大型语言模型(LLM)的内存使用。NAMM像一位精明的编辑,能识别并剔除冗余信息,保留关键内容,从而将LLM的内存成本降低高达75%,同时提升性能。该技术适用于多种模型和任务,为企业应用LLM带来了巨大的成本和效率优势。
阅读更多
日本初创公司Sakana AI研发了一种名为“通用Transformer内存”的新技术,通过特殊的“神经注意力记忆模块”(NAMM),可有效优化大型语言模型(LLM)的内存使用。NAMM像一位精明的编辑,能识别并剔除冗余信息,保留关键内容,从而将LLM的内存成本降低高达75%,同时提升性能。该技术适用于多种模型和任务,为企业应用LLM带来了巨大的成本和效率优势。
阅读更多
以色列音频AI初创公司aiOla发布了一款名为Whisper-NER的开源AI转录模型,该模型基于OpenAI的Whisper模型构建,可实时识别并屏蔽敏感信息,如姓名、电话号码和地址等。该模型已在Hugging Face和Github上开源,供企业、组织和个人使用、修改和部署。aiOla称,Whisper-NER采用ASR和NER集成的方式,在转录过程中直接标记或屏蔽敏感信息,无需额外的软件步骤,提高了数据安全性,并支持零样本学习,可识别未经训练的实体类型。
阅读更多
以色列初创公司 xpander.ai 推出了 Agent Graph System (AGS),这是一种构建更可靠、高效的多步骤 AI 代理的新方法,它基于 OpenAI 的 GPT-4o 等底层 AI 模型。AGS 使用基于图形的工作流,逐步引导代理进行适当的 API 调用,解决了多步骤 AI 代理在复杂 API 模式或不可预测响应方面遇到的挑战。通过基准测试,xpander.ai 证明 AGS 与其代理接口配合使用,可使 AI 代理在多步骤任务中的成功率达到 98%,而传统方法的成功率仅为 24%。AGS 简化了流程,确保工具以正确的顺序使用,并始终遵循模式。
阅读更多
苹果公司发布了一种名为Depth Pro的全新AI模型,该模型可以仅凭单张2D图像生成详细的3D深度地图,速度极快,且无需依赖传统的相机数据。Depth Pro不仅速度快、精度高,还能提供真实世界的测量结果,并应用于增强现实等领域。该模型具有零样本学习能力,无需针对特定领域数据集进行大量训练,即可应用于各种图像。苹果公司已将Depth Pro开源,以加速其应用。
阅读更多
微软模拟飞行2024展现了惊人的雄心,游戏开发历时四年,汇集了800名开发者的努力。该作最引人注目的壮举之一是将计算从本地PC转移到云端,通过互联网连接的数据中心计算海量数据,并将模拟结果实时传输到用户的机器上进行可视化。此外,游戏还通过将虚拟环境的细节增加4000倍,对模拟地球进行了大规模增强,构建了一个高度精确的地球“数字孪生”。
阅读更多
Sarah's Scribbles 与 An Infinite Story 合作推出了一款名为“After Owning a Cat”的“隐藏艺术游戏”。这款游戏基于 Sarah Andersen 的艺术作品,玩家需要在 Sarah's Scribbles 漫画图片中寻找隐藏的猫咪。游戏采用 WebGL 技术,玩家可以通过缩放图片来发现隐藏的细节和猫咪。这款游戏是 An Infinite Story 平台的首款游戏,该平台旨在为用户提供全新的互动式故事体验。
阅读更多
在2024年DataGrail峰会上,行业专家对人工智能快速发展带来的风险发出警告。专家指出人工智能能力呈指数级增长,而现有的安全措施难以跟上,企业需要在人工智能安全系统方面加大投入,以应对未来人工智能发展带来的挑战。
阅读更多
谷歌发布了最新的人工智能模型Gemini 1.5 Pro,该模型在LMSYS聊天机器人排行榜上名列前茅,超越了OpenAI的GPT-4o和Anthropic的Claude-3.5 Sonnet。Gemini 1.5 Pro具备强大的多语言处理能力,在数学、复杂提示和编码等技术领域表现出色。该模型还拥有高达200万个token的扩展上下文窗口,能够处理海量信息。然而,该模型的发布也引发了人们对人工智能安全、伦理使用和潜在滥用的担忧。
阅读更多
英伟达与法国初创公司Mistral AI联合发布了一款名为Mistral-NeMo的新型语言模型,旨在为企业桌面带来强大的AI功能。该模型拥有120亿个参数和128,000个token的扩展上下文窗口,使其成为寻求在无需大量云资源的情况下实施AI解决方案的企业的强大工具。
阅读更多
致力于支持女性在科技领域发展的非营利组织Girls in Tech宣布在成立17年后关闭。创始人Adriana Gascoigne表示,做出这个决定并非易事,充满了悲伤和痛苦。Girls in Tech为女性提供了一个以赋权、支持和启发为基础的友好社区,帮助她们在科技行业取得成功。该组织的项目包括导师计划、编程训练营、创业挑战赛等,并组织了数千场线上和线下活动。Gascoigne鼓励大家继续努力消除科技领域的性别差距,并表示Girls in Tech的使命将以其他形式延续下去。
阅读更多
人工智能公司OpenAI近期收购了屏幕共享和协作初创公司Multi。Multi团队将加入OpenAI的ChatGPT桌面团队,致力于开发ChatGPT Mac桌面应用程序。此次收购引发了外界猜测,OpenAI或将利用Multi的技术,允许其AI模型(如GPT-4)“接管”用户的计算机,并根据文本或语音提示执行操作。
阅读更多
中国人工智能初创公司DeepSeek发布了开源代码语言模型DeepSeek Coder V2,该模型基于混合专家 (MoE) 架构,在编码和数学任务方面表现出色。DeepSeek Coder V2支持超过300种编程语言,并在多个基准测试中超越了GPT-4 Turbo、Claude 3 Opus和Gemini 1.5 Pro等最先进的闭源模型,成为首个达到这一成就的开源模型。DeepSeek Coder V2基于DeepSeek V2模型构建,并在包含代码和数学相关数据的6万亿token数据集上进行了预训练,具备处理复杂编码任务的能力,同时在通用推理和语言理解任务中也表现出色。
阅读更多
Nvidia发布了Nemotron-4 340B模型,该模型在合成数据生成方面取得了突破性进展,其性能可与GPT-4相媲美。该模型拥有9万亿个训练token,支持超过50种自然语言和40种编程语言,并以其商业友好的许可模式脱颖而出。Nemotron-4 340B的发布有望彻底改变各个行业,从医疗保健到金融,都能从其生成高质量合成数据的能力中受益。
阅读更多
Adobe公司因其更新后的服务条款引发用户强烈不满,争议主要集中在Adobe可以访问、查看或收听用户内容,并可能使用机器学习等技术对其进行分析。 尽管Adobe声明其分析内容是为了提供云功能、识别违规内容,并强调不会访问存储在用户本地设备上的内容,但这项条款的模糊性以及生成式人工智能技术的兴起,仍然引发了许多用户的担忧,部分用户甚至表示将取消Adobe Creative Cloud订阅。
阅读更多
微软和北航的研究人员联合发布了一种名为MoRA的新技术,用于高效地微调大型语言模型 (LLM)。MoRA是一种参数高效的微调(PEFT)技术,解决了其他流行技术(如低秩适应(LoRA))的一些局限性,特别适用于需要模型获取新知识的任务。与LoRA使用低秩矩阵不同,MoRA使用方形矩阵来更新参数,从而提高了模型学习和记忆新知识的能力。实验证明,MoRA在知识记忆、指令调整和数学推理等任务上均优于LoRA,为企业LLM应用提供了一种高效的微调方案。
阅读更多
人工智能的快速发展催生了新一代专为其需求设计的编程语言,Mojo 就是其中之一。Mojo 由 Swift 编程语言的创建者开发,旨在解决 Python 在 AI 开发中的性能瓶颈,同时保留其易用性和现有生态系统的优势。Mojo 凭借与 AI 硬件的无缝集成、对静态类型的支持以及创新的内存管理功能,有望彻底改变 AI 应用程序的构建方式,并为 AI 开发开创一个新时代。
阅读更多
本文批判了微软利用 Copilot+ 和人工智能电脑加强对用户控制的行为。作者回顾了个人电脑从开放到封闭的转变历程,指出微软利用操作系统和人工智能助手的深度绑定,将用户锁定在其生态系统中,构成变相的垄断。文章还批评了科技巨头日益强大的游说力量,以及政府监管不力的现状。最后,作者呼吁用户支持开放硬件和软件,并鼓励像 FUTO 这样的组织继续开发尊重用户、去中心化的软件,以保障数字自由。
阅读更多
Unity 已任命前 Zynga 高管马修·布隆伯格为其首席执行官。布隆伯格曾在 Zynga 担任首席运营官,负责该公司的移动游戏业务。在加入 Zynga 之前,他曾担任 EA 旗下手游工作室 Jam City 的首席执行官。Unity 联合创始人兼首席执行官约翰·里奇蒂埃洛将担任公司执行主席,并将继续参与公司的战略决策。
阅读更多