分类: AI

EQTY Lab联合英特尔和英伟达发布可验证计算AI框架

2024-12-18

EQTY Lab与英特尔和英伟达合作,发布了可验证计算AI框架,这是首个基于硬件的AI工作流程治理和审计解决方案。该框架利用硬件级加密技术,为AI训练、推理和基准测试提供真实可信的认证和合规性证明,确保AI的可解释性、问责制和安全性。它解决了AI供应链中日益增长的风险,例如AI投毒和信息泄露等,并支持与ServiceNow、Databricks和Palantir等工具集成。该技术已应用于生命科学、公共部门、金融和媒体等领域,帮助企业构建更安全、更可靠的AI系统。

人类思维速度:每秒仅10比特

2024-12-18

加州理工学院的研究人员发现,人类思维速度惊人地慢,仅为每秒10比特,远低于感官系统每秒10亿比特的接收速度。这项研究提出了一个悖论:为什么我们的思维如此缓慢?研究人员推测,这可能是因为人类大脑进化自简单的导航系统,只能循序渐进地处理信息,而非并行处理。这一发现或将挑战一些关于人机接口的科幻设想,因为即使通过脑机接口,人类的思维速度仍受限于每秒10比特。

大型语言模型间的合作文化演变

2024-12-18

研究人员探索了多个大型语言模型(LLM)代理在迭代部署中,能否在背叛的激励下学习互利的社会规范。实验发现,不同基础模型的合作演变差异显著,Claude 3.5 Sonnet的表现优于Gemini 1.5 Flash和GPT-4o。Claude 3.5 Sonnet还能利用额外的惩罚机制来提高得分。该研究提出了一种新的LLM基准测试方法,关注LLM代理部署对社会合作基础设施的影响,为构建更强大的AI代理提供了新的思路。

惠特克在NDSS 2024大会上解读AI与加密技术的未来

2024-12-18

在2024年NDSS网络与分布式系统安全研讨会上,Signal基金会主席Meredith Whittaker发表主题演讲,回顾了90年代的“密码战争”,并指出当前的加密政策格局受到政治、技术和商业压力的影响。她警告说,我们不能简单地将当前形势视为“密码战争2.0”,因为由个人数据、监控技术和AI/ML驱动的经济引擎构成了与90年代政府主导的加密技术截然不同的威胁。Whittaker强调,我们需要采取不同的应对措施,而NDSS的研究正处于这一应对措施的最前沿。

AI

迈向容错量子计算:Megaquop机器的曙光

2024-12-18

加州理工学院的John Preskill教授在Q2B 2024大会上发表了主题演讲,探讨了超越NISQ(嘈杂中型量子)时代,进入Megaquop(百万量子操作)时代的可能性。Megaquop机器预计能够执行百万级量子操作,虽然误差率仍然较高,但通过误差缓解技术和潜在的更高质量物理量子比特,有望实现一些经典计算机和NISQ机器无法完成的任务。Google、AWS等团队在量子纠错和硬件改进方面取得了显著进展,为Megaquop机器的实现奠定了基础。然而,Preskill教授也强调了挑战,包括量子纠错的解码速度、抗宇宙射线干扰以及寻找具有商业价值的应用等。未来,Megaquop机器的应用可能包括对复杂量子系统的模拟和材料科学研究。

告别Adam:初始化学习率缩放是训练Transformer的关键

2024-12-18

研究人员提出了一种名为SGD-SaI的新型优化器,它对随机梯度下降法进行了改进。SGD-SaI通过根据梯度信噪比对不同参数组进行初始化学习率缩放,从而避免了训练不平衡问题,并且在内存效率方面远超AdamW。在各种Transformer模型任务(包括图像分类和大型语言模型预训练)中,SGD-SaI的表现与AdamW不相上下甚至更好,展现出其在不同应用中的鲁棒性和实用性。

新型仿生机器人Exbody2实现高保真全身运动模仿

2024-12-18

研究人员开发了一种名为Exbody2的全身运动跟踪框架,使人形机器人能够像人类一样稳定地执行富有表现力的动作。该框架利用强化学习在模拟环境中进行训练,然后转移到现实世界。它解耦了关键点跟踪和速度控制,并有效地利用特权教师策略将精确的模仿技能提炼到目标学生策略中,从而能够高保真地复制跑步、蹲伏、跳舞等动态动作。实验结果表明,Exbody2在两个不同的人形机器人平台上均取得了优于现有技术的性能,为人形机器人的全身控制提供了实用指南。

谷歌搜索引擎:质量下降引用户不满

2024-12-18

SEO专家Elie Berreby指出,谷歌搜索质量持续下降,引发用户广泛不满。通过分析YouTube评论等非官方渠道的用户反馈,他发现用户抱怨搜索结果质量下降、广告过度、AI概览窃取内容等问题。谷歌的策略似乎更注重盈利,忽视了用户体验,这可能导致用户转向其他搜索引擎。文章警告谷歌,若不改进,将面临严重后果。

开源框架FastVideo加速大型视频扩散模型

2024-12-17

FastVideo是一个开源框架,旨在加速大型视频扩散模型的推理和训练。它支持FastMochi和FastHunyuan等模型,能够将推理速度提升8倍。该框架利用知识蒸馏技术,并支持基于PCM的视频DiT模型的蒸馏、微调和推理。此外,FastVideo还具有可扩展的训练功能,支持FSDP、序列并行和选择性激活检查点,并能高效地利用内存进行微调。

意识计算:注意力是电磁场线管理的新模型

2024-12-17

Qualia计算研究所提出了一种新颖的注意力模型,该模型将注意力视为大脑电磁场中动态模式的管理。通过模拟谐波振荡的加权组合产生的电场线,研究人员展示了注意力如何通过调节潜在的谐振模式来控制电荷密度,从而解释了注意力行为中看似随机的波动和漂移。该模型还提供了对迷幻体验的潜在解释,认为迷幻剂通过改变谐波模式的配置来扰乱注意力的正常流动。这项研究为理解意识和开发新的神经干预技术提供了新的视角,例如通过非侵入性地扰动注意力的相位锁定来诱导意识的奇特状态。

AI

Modular发布MAX 24.6:原生GPU生成式AI平台

2024-12-17

Modular发布了MAX 24.6,一个原生GPU生成式AI平台,旨在重新定义AI的开发和部署方式。MAX 24.6的核心是MAX GPU,一个垂直整合的生成式AI服务堆栈,摆脱了对NVIDIA CUDA等厂商专用计算库的依赖。它基于高性能AI模型编译器和运行时MAX Engine以及Python原生服务层MAX Serve,支持整个AI开发流程,从实验到生产部署。MAX 24.6支持多种硬件平台,包括NVIDIA A100、L40、L4和A10加速器,并计划支持H100、H200和AMD GPU。其与Hugging Face模型兼容,并提供OpenAI兼容的客户端API。MAX 24.6在Llama 3.1模型上实现了3860个输出token/秒的吞吐量,与vLLM性能相当,并具有更小的Docker镜像尺寸。

斯坦福报告警告:镜像细菌的风险与可行性

2024-12-17

斯坦福大学发布的一份技术报告详细评估了创造“镜像细菌”的可行性及其潜在风险。镜像细菌的所有手性分子(蛋白质、核酸和代谢物)都是其镜像,这使得它们无法通过自然进化产生,但随着科学进步,其人工合成日益可行。由于免疫系统和捕食机制依赖于手性分子间的相互作用,镜像细菌可能逃避免疫系统和天敌的捕杀,从而不受控制地传播,并对人类、动物、植物和环境构成严重威胁。报告涵盖了镜像细菌的合成、生物安全、对人体健康、医疗对策以及生态影响等多个方面,呼吁对这一潜在的生物安全风险高度重视。

AI

数据恐龙:揭秘统计陷阱

2024-12-17

十三组数据,统计指标惊人相似,但图表形态却千差万别!这就是“数据恐龙”数据集的魅力所在。它由恐龙形状的数据集和其它十二个形状各异的数据集组成,它们都拥有几乎相同的均值、方差和相关系数等基本统计量。这有力地说明了:仅依赖简单的统计指标分析数据是多么危险,可视化分析的重要性不言而喻。这组数据集合旨在警示数据分析师,在进行数据分析之前,必须先进行数据可视化,避免被统计数据误导,做出错误的判断。

麻省理工学院研究揭示法律文本难以理解的原因

2024-12-17

麻省理工学院认知科学家的一项新研究揭示了法律文本晦涩难懂的原因。研究发现,法律语言的复杂性并非源于不断修改和添加信息,而是为了营造权威感,如同魔法咒语般,复杂的句式结构和专业术语被用来彰显其特殊地位。研究人员通过实验发现,即使是非专业人士,在撰写法律文本时也会不自觉地使用这种复杂的语言风格。这项研究或将推动立法者们致力于使法律文本更易于理解。

AI

Waymo 将自动驾驶汽车带到东京

2024-12-17

Waymo 宣布与日本交通株式会社(Nihon Kotsu)和 GO 合作,于 2025 年初将自动驾驶汽车首次引入东京。这标志着 Waymo 向国际扩张迈出的重要一步,其自动驾驶系统将面临左驾和东京复杂交通环境的挑战。Waymo 将与当地合作伙伴、政府官员和社区团体合作,了解当地交通状况,并确保其技术的安全性和性能。此次合作也符合日本政府发展未来交通的愿景。

革命性技术:内存成本降低高达75%!

2024-12-17

日本初创公司Sakana AI研发了一种名为“通用Transformer内存”的新技术,通过特殊的“神经注意力记忆模块”(NAMM),可有效优化大型语言模型(LLM)的内存使用。NAMM像一位精明的编辑,能识别并剔除冗余信息,保留关键内容,从而将LLM的内存成本降低高达75%,同时提升性能。该技术适用于多种模型和任务,为企业应用LLM带来了巨大的成本和效率优势。

AI

nCompass:大幅降低AI模型推理成本的创新方案

2024-12-16

nCompass Technologies开发了一种创新的AI推理服务软件,能够将大规模AI模型服务的成本降低50%。该软件通过定制的AI推理服务软件和硬件感知请求调度程序以及Kubernetes自动缩放器,在更少的GPU上保持高质量的服务,从而显著提升响应速度,最高可达4倍,并降低GPU基础设施成本。用户可通过API访问开源模型,无速率限制,并享有100美元的注册信用额度。nCompass还提供本地部署方案,适用于对成本和响应速度有高要求的企业。

AI

AI绘图大比拼:鹈鹕骑自行车

2024-12-16

博主Simon Willison设计了一个独特的LLM基准测试:让不同模型生成一只骑自行车的鹈鹕的SVG图像。他选择了这个主题是因为其独特性,避免模型从已有数据中学习。测试涵盖了来自OpenAI、Anthropic、谷歌Gemini和Meta等多个模型,结果显示不同模型的生成效果差异显著,部分模型生成的图像较为成功,而其他模型则表现不佳。

AI

AI助力揭秘柏林墙壁画颜料化学成分

2024-12-16

意大利科学家利用人工智能神经网络分析便携式拉曼光谱仪获取的光谱数据,成功揭开了柏林墙壁画颜料的神秘面纱。这项研究不仅帮助我们了解了这些具有历史意义的壁画的绘画材料和工艺,也为未来街头的艺术品保护提供了新的技术手段。研究人员通过分析壁画碎片,结合拉曼光谱、X射线荧光光谱和光纤反射光谱等多种技术,并运用自主研发的AI算法SAPNet,精确识别出壁画中所使用的颜料成分比例,例如钛白和高达75%的其它颜料。这项突破性研究展示了人工智能在文化遗产保护领域的巨大潜力。

爱达·洛夫莱斯程序:世界首个复杂程序的传奇

2024-12-16

本文探讨了爱达·洛夫莱斯为巴贝奇分析机编写的程序,该程序旨在计算伯努利数。文章详细解释了伯努利数的数学背景,以及巴贝奇分析机的运作原理。洛夫莱斯的程序虽然从未运行,但其严谨性及对循环和变量状态追踪的巧妙运用,使其被认为是世界上第一个复杂程序,预示了现代编程的许多要素。文章还分析了程序中发现的bug,并讨论了洛夫莱斯在计算史上的地位,强调了她对编程思想的贡献超越了简单的计算,她预见到了计算机的巨大潜力,远超同时代人。

Google DeepMind发布Veo 2:AI视频生成技术新突破

2024-12-16

Google DeepMind近日发布了其最新AI视频生成模型Veo 2,该模型在逼真度、细节和运动表现方面取得了显著进步,能够根据复杂的指令生成高质量的4K视频。Veo 2超越了其他领先的AI视频生成模型,其生成视频的真实感和对指令的准确遵循能力都得到了提升。从极近景拍摄的DJ特写到展现细腻物理效果的美食场景,Veo 2展现了其在不同风格和场景下的强大能力,标志着AI视频生成技术迈入了新的里程碑。

Perplexity:AI搜索引擎超越谷歌,开启搜索新纪元

2024-12-16

资深科技评论员回顾了搜索引擎的演变历程,从早期的AltaVista到谷歌的称霸,再到如今AI搜索引擎的崛起。文章指出,谷歌由于过度依赖广告,搜索结果质量下降,而Perplexity凭借其AI驱动、提供信息来源链接、并注重用户体验的优势,成为新的搜索引擎佼佼者。作者认为,尽管AI答案并非完美无缺,但Perplexity提供的可验证来源弥补了这一不足,为用户提供了更准确、更可靠的搜索体验。谷歌的未来面临挑战,其能否重拾辉煌,仍有待观察。

百万美元悬赏:开源AI编程竞赛K奖启动

2024-12-16

Andy Konwinski发起了一项名为K奖的百万美元竞赛,旨在推动开源AI代码能力的进步。该竞赛基于一个改进版的SWE-bench基准测试,该版本去除了测试集污染,以更准确地评估AI模型的真实编码能力。Konwinski受到Netflix Prize的启发,相信竞赛能够促进AI研究发展,并吸引全球顶尖人才参与。

苹果AI功能用户评价褒贬不一

2024-12-16

一项最新调查显示,虽然iPhone用户在选择新手机时将AI功能列为重要考虑因素,但目前苹果的AI智能功能(如撰写工具、通知摘要等)并未给大多数用户带来显著价值提升,仅有少数用户表示满意。不过,iOS 18.2加入的Genmoji和ChatGPT集成功能有望改变这一现状。

英伟达Meshtron:大规模高保真3D网格生成

2024-12-16

英伟达的研究人员开发了一种名为Meshtron的全新模型,能够以空前的规模和保真度生成高质量的3D网格。该模型采用自回归架构和滑动窗口注意力机制,通过将网格表示为一系列标记并利用Hourglass Transformer架构,有效地解决了现有方法在生成复杂3D模型时面临的效率和可扩展性问题。Meshtron生成的网格细节丰富,逼近专业艺术家水平,可控性强,支持多种控制输入,如点云、面数和创意程度等,为动画、游戏和虚拟环境等领域带来更逼真的3D资产生成。

AI

研究表明:玩电子游戏或可提升儿童智商

2024-12-16

一项针对近万名9至10岁美国儿童的研究发现,玩电子游戏时间较长的孩子,智商得分高于平均水平。研究人员控制了遗传和社会经济背景等因素,结果显示,玩游戏的孩子在阅读理解、视觉空间处理和认知能力测试中得分更高,平均智商提升2.5分。虽然该研究样本仅限于美国儿童,且未区分游戏类型,但其结果仍为游戏与智力发展之间的关系提供了宝贵见解,挑战了长期以来“游戏有害儿童身心”的观念。研究人员强调,还需要进一步研究来确认因果关系,并探讨其他环境因素的影响。

微软发布新型小型语言模型Phi-4,擅长复杂推理

2024-12-15

微软发布了其最新的140亿参数小型语言模型Phi-4,该模型在数学等复杂推理领域表现出色,优于许多更大的模型,例如Gemini Pro 1.5。Phi-4的成功源于高质量的合成数据集、高质量的有机数据以及训练后的创新。目前,Phi-4已在Azure AI Foundry上提供,下周将在Hugging Face上发布。微软还强调了其对负责任AI开发的承诺,并提供了多种安全功能,以确保Phi-4的可靠和安全使用。

新型AI攻击技术“最佳N次尝试”攻破AI系统

2024-12-15

研究人员开发了一种名为“最佳N次尝试”(BoN)的AI攻击算法,该算法通过反复修改提示信息(例如随机打乱或大写文本提示),直到诱导AI系统给出有害回应。实验表明,BoN在闭源语言模型(如GPT-4o和Claude 3.5 Sonnet)上取得了高达89%和78%的攻击成功率,并且能够有效绕过现有防御机制,甚至扩展到视觉和音频语言模型。该研究表明,即使是先进的语言模型也容易受到看似无害的输入变化的影响,这为AI安全敲响了警钟。

3

AI可视化:相似城市道路网络

2024-12-15

一个名为similar-cities的网站利用AI技术,通过比较城市道路网络的相似性来可视化城市间的联系。该网站使用一种基于“醉汉漫步”算法的独特方法,计算城市道路网络中随机路径的相似度,从而评估城市结构的相似性。数据来源于OpenStreetMap,包含约2500个城市。该项目开源,并提供详细的算法说明和代码,期待更多城市数据的加入以提升结果的准确性。

2 4