Hugging Face发布299美元桌面机器人Reachy Mini,剑指机器人开发民主化

2025-07-10
Hugging Face发布299美元桌面机器人Reachy Mini,剑指机器人开发民主化

Hugging Face,这家估值45亿美元的AI平台,被称为机器学习领域的GitHub,发布了其首款消费级产品——售价299美元的桌面机器人Reachy Mini。这款11英寸的类人机器人旨在将AI驱动的机器人技术普及给全球数百万开发者,挑战行业传统的封闭式、高成本模式。Reachy Mini集成了Hugging Face Hub,开发者可访问数千个预构建AI模型,并通过平台的“Spaces”功能共享机器人应用程序。Hugging Face此举意在推动物理AI的下一阶段发展,并通过开源硬件和软件设计,降低机器人开发的门槛,从而构建一个繁荣的机器人应用生态系统。

阅读更多
AI

德国公司TNG发布高效开源大模型DeepSeek-TNG R1T2 Chimera

2025-07-05
德国公司TNG发布高效开源大模型DeepSeek-TNG R1T2 Chimera

德国TNG公司基于开源模型DeepSeek-R1-0528,利用其独创的专家组装法(AoE),发布了新的高效大语言模型DeepSeek-TNG R1T2 Chimera。该模型在推理速度和效率上有了显著提升,推理速度是DeepSeek-R1-0528的两倍以上,同时保持了90%以上的推理能力,并且输出结果更简洁。R1T2采用MIT许可证开源,已在Hugging Face平台上线,为企业和研究提供了更经济高效的AI解决方案。

阅读更多
AI

微软Bing整合Sora:免费AI视频生成器来袭

2025-06-10
微软Bing整合Sora:免费AI视频生成器来袭

微软将OpenAI的Sora视频生成技术整合进Bing移动端应用,推出免费的Bing Video Creator。用户只需输入文字提示,即可生成5秒短视频,未来还将支持横向视频。虽然目前功能有限,仅支持文本生成视频,且免费生成次数有限,但其便捷性和易用性使其成为一款极具吸引力的工具,为用户带来轻松创作视频的体验。此举不仅为消费者提供便捷的视频创作工具,也为企业用户提供了探索AI视频生成技术应用的可能性,例如自动生成视频摘要、培训内容或营销素材等。

阅读更多
科技

Gemini 2.5:Google AI 助理的重大飞跃

2025-05-20
Gemini 2.5:Google AI 助理的重大飞跃

Google在I/O大会上发布了Gemini 2.5的重大升级,包括更强大的Gemini 2.5 Pro和更快速的Gemini 2.5 Flash。Pro版本新增“Deep Think”模式,能够进行多重假设推理,在数学和编码基准测试中取得了令人印象深刻的成绩。Flash版本则在推理、多模态和代码方面都有显著提升,效率也更高。两者都增加了原生音频输出、文本转语音、思维摘要和思维预算等功能,支持多种语言和方言,并增强了与开源工具的集成。Google的目标是打造一个能够理解上下文、规划并采取行动的“通用AI助理”,Gemini 2.5正朝着这一目标迈进。

阅读更多
AI

阿里巴巴ZeroSearch:无需搜索引擎即可训练AI搜索

2025-05-09
阿里巴巴ZeroSearch:无需搜索引擎即可训练AI搜索

阿里巴巴研究人员开发了一种名为ZeroSearch的新技术,彻底改变了AI搜索能力的训练方式。该技术通过模拟搜索结果,无需依赖昂贵的商业搜索引擎API,即可训练大型语言模型(LLM)具备强大的搜索功能。这不仅大幅降低了训练成本(高达88%),还提升了对训练数据的控制力,让小型AI公司也能参与先进AI搜索技术的开发。ZeroSearch在七个问答数据集上的表现优异,甚至超越了使用真实搜索引擎训练的模型。这项突破预示着AI未来可能更多地依靠自模拟学习,减少对外部服务的依赖。

阅读更多
AI

任天堂推出虚拟游戏卡,实现Switch游戏跨设备共享

2025-03-27
任天堂推出虚拟游戏卡,实现Switch游戏跨设备共享

任天堂在近日的直面会上公布了Switch的虚拟游戏卡,将于四月下旬推出。这项新功能允许玩家在不同的Switch主机之间共享数字游戏。购买的数字游戏将以虚拟游戏卡的形式储存在专用管理界面,玩家可以虚拟加载和弹出游戏卡,如同使用实体卡带一样方便。同一款游戏最多可在两台Switch主机上游玩,并支持通过本地无线网络与家人共享游戏,共享期限为两周。这项创新将大大提升数字游戏的灵活性,并为玩家带来更便捷的游戏体验。

阅读更多

Mayo诊所用逆向RAG技术解决LLM幻觉问题

2025-03-15
Mayo诊所用逆向RAG技术解决LLM幻觉问题

大型语言模型(LLM)的“幻觉”问题——即生成不准确信息——在医疗领域尤其危险。Mayo诊所采用了一种创新的“逆向RAG”技术来解决这个问题。该技术通过将模型提取的信息与原始数据源链接,消除了几乎所有基于数据检索的幻觉,从而能够在临床实践中推广使用该模型。这项技术结合了CURE算法和向量数据库,确保了每个数据点都能被追溯到原始来源,提高了模型的可靠性和可信度,显著减少了医生的工作负担,并为个性化医疗提供了新的可能。

阅读更多

PIN AI:你的私人AI,由你掌控

2025-02-15
PIN AI:你的私人AI,由你掌控

PIN AI 是一款运行在手机上的去中心化个人AI应用,它挑战了科技巨头对用户数据的垄断。不同于云端AI,PIN AI 将AI模型直接运行在用户的手机上,确保隐私和个性化定制。用户拥有自己的数据,并可以控制AI模型的训练。PIN AI 已经拥有超过200万的 alpha 用户,并得到了 a16z Crypto 等知名投资机构的支持。它旨在打造一个用户主导的AI生态,让个人拥有并控制自己的AI助手,如同钢铁侠的J.A.R.V.I.S.一样。

阅读更多

阿里巴巴Qwen2.5-Max挑战美国科技巨头,重塑企业AI格局

2025-01-29
阿里巴巴Qwen2.5-Max挑战美国科技巨头,重塑企业AI格局

阿里巴巴云发布了其Qwen2.5-Max模型,这是不到一周内中国发布的第二个重大AI突破,进一步冲击了美国科技市场,加剧了人们对其AI领导地位日益丧失的担忧。该模型在Arena-Hard、LiveBench和LiveCodeBench等关键基准测试中均优于DeepSeek的R1模型,并在高级推理和知识测试中与GPT-4o和Claude-3.5-Sonnet等行业领导者展现出竞争力。Qwen2.5-Max采用混合专家架构,在训练过程中使用了超过20万亿个token,但却比传统方法需要更少的计算资源。这一高效的模型,为企业AI部署带来了新的可能性,可能降低40%-60%的基础设施成本。然而,数据主权、API可靠性和长期支持等问题仍需考虑。

阅读更多

Colossal公司获2亿美元融资,欲复活猛犸象等灭绝物种

2025-01-16
Colossal公司获2亿美元融资,欲复活猛犸象等灭绝物种

Colossal BioSciences公司获得2亿美元融资,目标是“复活”猛犸象、袋狼和渡渡鸟等灭绝物种。该公司利用基因工程技术,结合AI和计算生物学,取得了显著进展,已获得多个物种的完整基因组。除了“去灭绝”项目,Colossal还致力于物种保护和人类医疗保健。此次融资将用于扩大团队,开发新技术,并扩展“去灭绝”物种名单。

阅读更多
科技 灭绝物种

革命性技术:内存成本降低高达75%!

2024-12-17
革命性技术:内存成本降低高达75%!

日本初创公司Sakana AI研发了一种名为“通用Transformer内存”的新技术,通过特殊的“神经注意力记忆模块”(NAMM),可有效优化大型语言模型(LLM)的内存使用。NAMM像一位精明的编辑,能识别并剔除冗余信息,保留关键内容,从而将LLM的内存成本降低高达75%,同时提升性能。该技术适用于多种模型和任务,为企业应用LLM带来了巨大的成本和效率优势。

阅读更多
AI

aiOla发布开源AI转录模型,可实时屏蔽敏感信息

2024-11-24

以色列音频AI初创公司aiOla发布了一款名为Whisper-NER的开源AI转录模型,该模型基于OpenAI的Whisper模型构建,可实时识别并屏蔽敏感信息,如姓名、电话号码和地址等。该模型已在Hugging Face和Github上开源,供企业、组织和个人使用、修改和部署。aiOla称,Whisper-NER采用ASR和NER集成的方式,在转录过程中直接标记或屏蔽敏感信息,无需额外的软件步骤,提高了数据安全性,并支持零样本学习,可识别未经训练的实体类型。

阅读更多
未分类 AI转录

xpander.ai 的 Agent Graph System 使 AI 代理的可靠性提高四倍

2024-11-22

以色列初创公司 xpander.ai 推出了 Agent Graph System (AGS),这是一种构建更可靠、高效的多步骤 AI 代理的新方法,它基于 OpenAI 的 GPT-4o 等底层 AI 模型。AGS 使用基于图形的工作流,逐步引导代理进行适当的 API 调用,解决了多步骤 AI 代理在复杂 API 模式或不可预测响应方面遇到的挑战。通过基准测试,xpander.ai 证明 AGS 与其代理接口配合使用,可使 AI 代理在多步骤任务中的成功率达到 98%,而传统方法的成功率仅为 24%。AGS 简化了流程,确保工具以正确的顺序使用,并始终遵循模式。

阅读更多
未分类

苹果发布突破性AI模型Depth Pro,改写3D视觉规则

2024-10-05
苹果发布突破性AI模型Depth Pro,改写3D视觉规则

苹果公司发布了一种名为Depth Pro的全新AI模型,该模型可以仅凭单张2D图像生成详细的3D深度地图,速度极快,且无需依赖传统的相机数据。Depth Pro不仅速度快、精度高,还能提供真实世界的测量结果,并应用于增强现实等领域。该模型具有零样本学习能力,无需针对特定领域数据集进行大量训练,即可应用于各种图像。苹果公司已将Depth Pro开源,以加速其应用。

阅读更多
未分类 3D视觉

微软模拟飞行2024:元宇宙的重生?

2024-09-27
微软模拟飞行2024:元宇宙的重生?

微软模拟飞行2024展现了惊人的雄心,游戏开发历时四年,汇集了800名开发者的努力。该作最引人注目的壮举之一是将计算从本地PC转移到云端,通过互联网连接的数据中心计算海量数据,并将模拟结果实时传输到用户的机器上进行可视化。此外,游戏还通过将虚拟环境的细节增加4000倍,对模拟地球进行了大规模增强,构建了一个高度精确的地球“数字孪生”。

阅读更多
未分类 微软模拟飞行

Sarah Andersen 漫画推出“隐藏艺术游戏” Sarah's Scribbles

2024-09-21
Sarah Andersen 漫画推出“隐藏艺术游戏” Sarah's Scribbles

Sarah's Scribbles 与 An Infinite Story 合作推出了一款名为“After Owning a Cat”的“隐藏艺术游戏”。这款游戏基于 Sarah Andersen 的艺术作品,玩家需要在 Sarah's Scribbles 漫画图片中寻找隐藏的猫咪。游戏采用 WebGL 技术,玩家可以通过缩放图片来发现隐藏的细节和猫咪。这款游戏是 An Infinite Story 平台的首款游戏,该平台旨在为用户提供全新的互动式故事体验。

阅读更多
未分类 互动故事

谷歌Gemini 1.5 Pro人工智能领域大跃进,挑战GPT-4o

2024-08-02
谷歌Gemini 1.5 Pro人工智能领域大跃进,挑战GPT-4o

谷歌发布了最新的人工智能模型Gemini 1.5 Pro,该模型在LMSYS聊天机器人排行榜上名列前茅,超越了OpenAI的GPT-4o和Anthropic的Claude-3.5 Sonnet。Gemini 1.5 Pro具备强大的多语言处理能力,在数学、复杂提示和编码等技术领域表现出色。该模型还拥有高达200万个token的扩展上下文窗口,能够处理海量信息。然而,该模型的发布也引发了人们对人工智能安全、伦理使用和潜在滥用的担忧。

阅读更多
未分类

科技女性组织Girls in Tech在成立17年后关闭

2024-07-10
科技女性组织Girls in Tech在成立17年后关闭

致力于支持女性在科技领域发展的非营利组织Girls in Tech宣布在成立17年后关闭。创始人Adriana Gascoigne表示,做出这个决定并非易事,充满了悲伤和痛苦。Girls in Tech为女性提供了一个以赋权、支持和启发为基础的友好社区,帮助她们在科技行业取得成功。该组织的项目包括导师计划、编程训练营、创业挑战赛等,并组织了数千场线上和线下活动。Gascoigne鼓励大家继续努力消除科技领域的性别差距,并表示Girls in Tech的使命将以其他形式延续下去。

阅读更多

OpenAI收购屏幕共享初创公司Multi团队

2024-06-24
OpenAI收购屏幕共享初创公司Multi团队

人工智能公司OpenAI近期收购了屏幕共享和协作初创公司Multi。Multi团队将加入OpenAI的ChatGPT桌面团队,致力于开发ChatGPT Mac桌面应用程序。此次收购引发了外界猜测,OpenAI或将利用Multi的技术,允许其AI模型(如GPT-4)“接管”用户的计算机,并根据文本或语音提示执行操作。

阅读更多
未分类

中国DeepSeek Coder成为首个超越GPT-4 Turbo的开源编码模型

2024-06-19
中国DeepSeek Coder成为首个超越GPT-4 Turbo的开源编码模型

中国人工智能初创公司DeepSeek发布了开源代码语言模型DeepSeek Coder V2,该模型基于混合专家 (MoE) 架构,在编码和数学任务方面表现出色。DeepSeek Coder V2支持超过300种编程语言,并在多个基准测试中超越了GPT-4 Turbo、Claude 3 Opus和Gemini 1.5 Pro等最先进的闭源模型,成为首个达到这一成就的开源模型。DeepSeek Coder V2基于DeepSeek V2模型构建,并在包含代码和数学相关数据的6万亿token数据集上进行了预训练,具备处理复杂编码任务的能力,同时在通用推理和语言理解任务中也表现出色。

阅读更多

Nvidia发布Nemotron-4 340B模型,重新定义合成数据生成

2024-06-16
Nvidia发布Nemotron-4 340B模型,重新定义合成数据生成

Nvidia发布了Nemotron-4 340B模型,该模型在合成数据生成方面取得了突破性进展,其性能可与GPT-4相媲美。该模型拥有9万亿个训练token,支持超过50种自然语言和40种编程语言,并以其商业友好的许可模式脱颖而出。Nemotron-4 340B的发布有望彻底改变各个行业,从医疗保健到金融,都能从其生成高质量合成数据的能力中受益。

阅读更多
未分类 Nvidia

Adobe 回应新版服务条款争议

2024-06-06
Adobe 回应新版服务条款争议

Adobe公司因其更新后的服务条款引发用户强烈不满,争议主要集中在Adobe可以访问、查看或收听用户内容,并可能使用机器学习等技术对其进行分析。 尽管Adobe声明其分析内容是为了提供云功能、识别违规内容,并强调不会访问存储在用户本地设备上的内容,但这项条款的模糊性以及生成式人工智能技术的兴起,仍然引发了许多用户的担忧,部分用户甚至表示将取消Adobe Creative Cloud订阅。

阅读更多

微软和北航联合发布MoRA:一种高效的大语言模型微调技术

2024-05-29
微软和北航联合发布MoRA:一种高效的大语言模型微调技术

微软和北航的研究人员联合发布了一种名为MoRA的新技术,用于高效地微调大型语言模型 (LLM)。MoRA是一种参数高效的微调(PEFT)技术,解决了其他流行技术(如低秩适应(LoRA))的一些局限性,特别适用于需要模型获取新知识的任务。与LoRA使用低秩矩阵不同,MoRA使用方形矩阵来更新参数,从而提高了模型学习和记忆新知识的能力。实验证明,MoRA在知识记忆、指令调整和数学推理等任务上均优于LoRA,为企业LLM应用提供了一种高效的微调方案。

阅读更多
未分类

Mojo 崛起:人工智能优先编程语言的复兴

2024-05-26
Mojo 崛起:人工智能优先编程语言的复兴

人工智能的快速发展催生了新一代专为其需求设计的编程语言,Mojo 就是其中之一。Mojo 由 Swift 编程语言的创建者开发,旨在解决 Python 在 AI 开发中的性能瓶颈,同时保留其易用性和现有生态系统的优势。Mojo 凭借与 AI 硬件的无缝集成、对静态类型的支持以及创新的内存管理功能,有望彻底改变 AI 应用程序的构建方式,并为 AI 开发开创一个新时代。

阅读更多
未分类 Mojo

微软的“怀柔政策”:Copilot+和人工智能电脑如何让企业依赖微软

2024-05-22
微软的“怀柔政策”:Copilot+和人工智能电脑如何让企业依赖微软

本文批判了微软利用 Copilot+ 和人工智能电脑加强对用户控制的行为。作者回顾了个人电脑从开放到封闭的转变历程,指出微软利用操作系统和人工智能助手的深度绑定,将用户锁定在其生态系统中,构成变相的垄断。文章还批评了科技巨头日益强大的游说力量,以及政府监管不力的现状。最后,作者呼吁用户支持开放硬件和软件,并鼓励像 FUTO 这样的组织继续开发尊重用户、去中心化的软件,以保障数字自由。

阅读更多
未分类 数字自由

Unity任命前Zynga高管马修·布隆伯格为首席执行官

2024-05-02
Unity任命前Zynga高管马修·布隆伯格为首席执行官

Unity 已任命前 Zynga 高管马修·布隆伯格为其首席执行官。布隆伯格曾在 Zynga 担任首席运营官,负责该公司的移动游戏业务。在加入 Zynga 之前,他曾担任 EA 旗下手游工作室 Jam City 的首席执行官。Unity 联合创始人兼首席执行官约翰·里奇蒂埃洛将担任公司执行主席,并将继续参与公司的战略决策。

阅读更多
未分类 Unity Zynga