分类: AI

意识计算:注意力是电磁场线管理的新模型

2024-12-17
意识计算:注意力是电磁场线管理的新模型

Qualia计算研究所提出了一种新颖的注意力模型,该模型将注意力视为大脑电磁场中动态模式的管理。通过模拟谐波振荡的加权组合产生的电场线,研究人员展示了注意力如何通过调节潜在的谐振模式来控制电荷密度,从而解释了注意力行为中看似随机的波动和漂移。该模型还提供了对迷幻体验的潜在解释,认为迷幻剂通过改变谐波模式的配置来扰乱注意力的正常流动。这项研究为理解意识和开发新的神经干预技术提供了新的视角,例如通过非侵入性地扰动注意力的相位锁定来诱导意识的奇特状态。

AI

Modular发布MAX 24.6:原生GPU生成式AI平台

2024-12-17
Modular发布MAX 24.6:原生GPU生成式AI平台

Modular发布了MAX 24.6,一个原生GPU生成式AI平台,旨在重新定义AI的开发和部署方式。MAX 24.6的核心是MAX GPU,一个垂直整合的生成式AI服务堆栈,摆脱了对NVIDIA CUDA等厂商专用计算库的依赖。它基于高性能AI模型编译器和运行时MAX Engine以及Python原生服务层MAX Serve,支持整个AI开发流程,从实验到生产部署。MAX 24.6支持多种硬件平台,包括NVIDIA A100、L40、L4和A10加速器,并计划支持H100、H200和AMD GPU。其与Hugging Face模型兼容,并提供OpenAI兼容的客户端API。MAX 24.6在Llama 3.1模型上实现了3860个输出token/秒的吞吐量,与vLLM性能相当,并具有更小的Docker镜像尺寸。

斯坦福报告警告:镜像细菌的风险与可行性

2024-12-17
斯坦福报告警告:镜像细菌的风险与可行性

斯坦福大学发布的一份技术报告详细评估了创造“镜像细菌”的可行性及其潜在风险。镜像细菌的所有手性分子(蛋白质、核酸和代谢物)都是其镜像,这使得它们无法通过自然进化产生,但随着科学进步,其人工合成日益可行。由于免疫系统和捕食机制依赖于手性分子间的相互作用,镜像细菌可能逃避免疫系统和天敌的捕杀,从而不受控制地传播,并对人类、动物、植物和环境构成严重威胁。报告涵盖了镜像细菌的合成、生物安全、对人体健康、医疗对策以及生态影响等多个方面,呼吁对这一潜在的生物安全风险高度重视。

AI

数据恐龙:揭秘统计陷阱

2024-12-17

十三组数据,统计指标惊人相似,但图表形态却千差万别!这就是“数据恐龙”数据集的魅力所在。它由恐龙形状的数据集和其它十二个形状各异的数据集组成,它们都拥有几乎相同的均值、方差和相关系数等基本统计量。这有力地说明了:仅依赖简单的统计指标分析数据是多么危险,可视化分析的重要性不言而喻。这组数据集合旨在警示数据分析师,在进行数据分析之前,必须先进行数据可视化,避免被统计数据误导,做出错误的判断。

麻省理工学院研究揭示法律文本难以理解的原因

2024-12-17
麻省理工学院研究揭示法律文本难以理解的原因

麻省理工学院认知科学家的一项新研究揭示了法律文本晦涩难懂的原因。研究发现,法律语言的复杂性并非源于不断修改和添加信息,而是为了营造权威感,如同魔法咒语般,复杂的句式结构和专业术语被用来彰显其特殊地位。研究人员通过实验发现,即使是非专业人士,在撰写法律文本时也会不自觉地使用这种复杂的语言风格。这项研究或将推动立法者们致力于使法律文本更易于理解。

AI

Waymo 将自动驾驶汽车带到东京

2024-12-17
Waymo 将自动驾驶汽车带到东京

Waymo 宣布与日本交通株式会社(Nihon Kotsu)和 GO 合作,于 2025 年初将自动驾驶汽车首次引入东京。这标志着 Waymo 向国际扩张迈出的重要一步,其自动驾驶系统将面临左驾和东京复杂交通环境的挑战。Waymo 将与当地合作伙伴、政府官员和社区团体合作,了解当地交通状况,并确保其技术的安全性和性能。此次合作也符合日本政府发展未来交通的愿景。

革命性技术:内存成本降低高达75%!

2024-12-17
革命性技术:内存成本降低高达75%!

日本初创公司Sakana AI研发了一种名为“通用Transformer内存”的新技术,通过特殊的“神经注意力记忆模块”(NAMM),可有效优化大型语言模型(LLM)的内存使用。NAMM像一位精明的编辑,能识别并剔除冗余信息,保留关键内容,从而将LLM的内存成本降低高达75%,同时提升性能。该技术适用于多种模型和任务,为企业应用LLM带来了巨大的成本和效率优势。

AI

nCompass:大幅降低AI模型推理成本的创新方案

2024-12-16

nCompass Technologies开发了一种创新的AI推理服务软件,能够将大规模AI模型服务的成本降低50%。该软件通过定制的AI推理服务软件和硬件感知请求调度程序以及Kubernetes自动缩放器,在更少的GPU上保持高质量的服务,从而显著提升响应速度,最高可达4倍,并降低GPU基础设施成本。用户可通过API访问开源模型,无速率限制,并享有100美元的注册信用额度。nCompass还提供本地部署方案,适用于对成本和响应速度有高要求的企业。

AI

AI绘图大比拼:鹈鹕骑自行车

2024-12-16

博主Simon Willison设计了一个独特的LLM基准测试:让不同模型生成一只骑自行车的鹈鹕的SVG图像。他选择了这个主题是因为其独特性,避免模型从已有数据中学习。测试涵盖了来自OpenAI、Anthropic、谷歌Gemini和Meta等多个模型,结果显示不同模型的生成效果差异显著,部分模型生成的图像较为成功,而其他模型则表现不佳。

AI

AI助力揭秘柏林墙壁画颜料化学成分

2024-12-16
AI助力揭秘柏林墙壁画颜料化学成分

意大利科学家利用人工智能神经网络分析便携式拉曼光谱仪获取的光谱数据,成功揭开了柏林墙壁画颜料的神秘面纱。这项研究不仅帮助我们了解了这些具有历史意义的壁画的绘画材料和工艺,也为未来街头的艺术品保护提供了新的技术手段。研究人员通过分析壁画碎片,结合拉曼光谱、X射线荧光光谱和光纤反射光谱等多种技术,并运用自主研发的AI算法SAPNet,精确识别出壁画中所使用的颜料成分比例,例如钛白和高达75%的其它颜料。这项突破性研究展示了人工智能在文化遗产保护领域的巨大潜力。

爱达·洛夫莱斯程序:世界首个复杂程序的传奇

2024-12-16
爱达·洛夫莱斯程序:世界首个复杂程序的传奇

本文探讨了爱达·洛夫莱斯为巴贝奇分析机编写的程序,该程序旨在计算伯努利数。文章详细解释了伯努利数的数学背景,以及巴贝奇分析机的运作原理。洛夫莱斯的程序虽然从未运行,但其严谨性及对循环和变量状态追踪的巧妙运用,使其被认为是世界上第一个复杂程序,预示了现代编程的许多要素。文章还分析了程序中发现的bug,并讨论了洛夫莱斯在计算史上的地位,强调了她对编程思想的贡献超越了简单的计算,她预见到了计算机的巨大潜力,远超同时代人。

Google DeepMind发布Veo 2:AI视频生成技术新突破

2024-12-16
Google DeepMind发布Veo 2:AI视频生成技术新突破

Google DeepMind近日发布了其最新AI视频生成模型Veo 2,该模型在逼真度、细节和运动表现方面取得了显著进步,能够根据复杂的指令生成高质量的4K视频。Veo 2超越了其他领先的AI视频生成模型,其生成视频的真实感和对指令的准确遵循能力都得到了提升。从极近景拍摄的DJ特写到展现细腻物理效果的美食场景,Veo 2展现了其在不同风格和场景下的强大能力,标志着AI视频生成技术迈入了新的里程碑。

Perplexity:AI搜索引擎超越谷歌,开启搜索新纪元

2024-12-16
Perplexity:AI搜索引擎超越谷歌,开启搜索新纪元

资深科技评论员回顾了搜索引擎的演变历程,从早期的AltaVista到谷歌的称霸,再到如今AI搜索引擎的崛起。文章指出,谷歌由于过度依赖广告,搜索结果质量下降,而Perplexity凭借其AI驱动、提供信息来源链接、并注重用户体验的优势,成为新的搜索引擎佼佼者。作者认为,尽管AI答案并非完美无缺,但Perplexity提供的可验证来源弥补了这一不足,为用户提供了更准确、更可靠的搜索体验。谷歌的未来面临挑战,其能否重拾辉煌,仍有待观察。

百万美元悬赏:开源AI编程竞赛K奖启动

2024-12-16

Andy Konwinski发起了一项名为K奖的百万美元竞赛,旨在推动开源AI代码能力的进步。该竞赛基于一个改进版的SWE-bench基准测试,该版本去除了测试集污染,以更准确地评估AI模型的真实编码能力。Konwinski受到Netflix Prize的启发,相信竞赛能够促进AI研究发展,并吸引全球顶尖人才参与。

苹果AI功能用户评价褒贬不一

2024-12-16
苹果AI功能用户评价褒贬不一

一项最新调查显示,虽然iPhone用户在选择新手机时将AI功能列为重要考虑因素,但目前苹果的AI智能功能(如撰写工具、通知摘要等)并未给大多数用户带来显著价值提升,仅有少数用户表示满意。不过,iOS 18.2加入的Genmoji和ChatGPT集成功能有望改变这一现状。

英伟达Meshtron:大规模高保真3D网格生成

2024-12-16
英伟达Meshtron:大规模高保真3D网格生成

英伟达的研究人员开发了一种名为Meshtron的全新模型,能够以空前的规模和保真度生成高质量的3D网格。该模型采用自回归架构和滑动窗口注意力机制,通过将网格表示为一系列标记并利用Hourglass Transformer架构,有效地解决了现有方法在生成复杂3D模型时面临的效率和可扩展性问题。Meshtron生成的网格细节丰富,逼近专业艺术家水平,可控性强,支持多种控制输入,如点云、面数和创意程度等,为动画、游戏和虚拟环境等领域带来更逼真的3D资产生成。

AI

研究表明:玩电子游戏或可提升儿童智商

2024-12-16
研究表明:玩电子游戏或可提升儿童智商

一项针对近万名9至10岁美国儿童的研究发现,玩电子游戏时间较长的孩子,智商得分高于平均水平。研究人员控制了遗传和社会经济背景等因素,结果显示,玩游戏的孩子在阅读理解、视觉空间处理和认知能力测试中得分更高,平均智商提升2.5分。虽然该研究样本仅限于美国儿童,且未区分游戏类型,但其结果仍为游戏与智力发展之间的关系提供了宝贵见解,挑战了长期以来“游戏有害儿童身心”的观念。研究人员强调,还需要进一步研究来确认因果关系,并探讨其他环境因素的影响。

微软发布新型小型语言模型Phi-4,擅长复杂推理

2024-12-15
微软发布新型小型语言模型Phi-4,擅长复杂推理

微软发布了其最新的140亿参数小型语言模型Phi-4,该模型在数学等复杂推理领域表现出色,优于许多更大的模型,例如Gemini Pro 1.5。Phi-4的成功源于高质量的合成数据集、高质量的有机数据以及训练后的创新。目前,Phi-4已在Azure AI Foundry上提供,下周将在Hugging Face上发布。微软还强调了其对负责任AI开发的承诺,并提供了多种安全功能,以确保Phi-4的可靠和安全使用。

新型AI攻击技术“最佳N次尝试”攻破AI系统

2024-12-15
新型AI攻击技术“最佳N次尝试”攻破AI系统

研究人员开发了一种名为“最佳N次尝试”(BoN)的AI攻击算法,该算法通过反复修改提示信息(例如随机打乱或大写文本提示),直到诱导AI系统给出有害回应。实验表明,BoN在闭源语言模型(如GPT-4o和Claude 3.5 Sonnet)上取得了高达89%和78%的攻击成功率,并且能够有效绕过现有防御机制,甚至扩展到视觉和音频语言模型。该研究表明,即使是先进的语言模型也容易受到看似无害的输入变化的影响,这为AI安全敲响了警钟。

3

AI可视化:相似城市道路网络

2024-12-15
AI可视化:相似城市道路网络

一个名为similar-cities的网站利用AI技术,通过比较城市道路网络的相似性来可视化城市间的联系。该网站使用一种基于“醉汉漫步”算法的独特方法,计算城市道路网络中随机路径的相似度,从而评估城市结构的相似性。数据来源于OpenStreetMap,包含约2500个城市。该项目开源,并提供详细的算法说明和代码,期待更多城市数据的加入以提升结果的准确性。

最大似然估计与损失函数的深层联系

2024-12-15
最大似然估计与损失函数的深层联系

本文深入探讨了最大似然估计(MLE)与常用损失函数之间的内在联系。作者从MLE的基本概念出发,逐步解释了其与KL散度的紧密关系,并以均方误差(MSE)和交叉熵为例,详细推导了它们如何从MLE自然地导出,而非人为设定。文章清晰地阐述了,通过假设数据分布(例如线性回归中的高斯分布,逻辑回归中的伯努利分布),利用MLE最大化似然函数,最终得到MSE和交叉熵损失函数。这为理解损失函数的理论基础提供了清晰的路径,不再仅仅停留在直觉层面。

机器人之舞:技术与艺术的共舞

2024-12-15
机器人之舞:技术与艺术的共舞

本文探讨了机器人舞蹈在艺术和技术发展中的演变。从Kraftwerk乐队的歌曲《我们都是机器人》出发,作者追溯了舞蹈风格从机械化到有机化的转变,以及人类对机械美学的迷恋。作者指出,现代机器人已经超越了传统的机械式动作,展现出更流畅、更具生命力的运动方式。这种转变反映了技术和艺术的共同发展,人类对机械的认知也从最初的恐惧与疏离转变为亲近与认同。

AI

模型上下文协议(MCP)构建反思:机遇与挑战并存

2024-12-15
模型上下文协议(MCP)构建反思:机遇与挑战并存

Anthropic提出的模型上下文协议(MCP)旨在连接大型语言模型(LLM)与外部工具和数据,例如Claude Desktop连接到数据库、搜索引擎等。虽然MCP为AI应用扩展功能提供了可能性,但其目前的实现仍存在一些不足:Claude Desktop仅支持本地服务器、缺乏对复杂输入的支持、存在客户端超时问题等。此外,MCP的文档和配置也需改进,例如建立官方注册表,支持异步任务调度和多客户端协作等,才能更好地服务用户。

Hugging Face Spaces 推出 ZeroGPU:动态 GPU 分配提升 AI 模型效率

2024-12-15
Hugging Face Spaces 推出 ZeroGPU:动态 GPU 分配提升 AI 模型效率

Hugging Face Spaces 推出了 ZeroGPU,这是一个动态分配 NVIDIA A100 GPU 的共享基础设施,旨在优化 AI 模型和演示的 GPU 使用效率。ZeroGPU 支持免费 GPU 访问、多 GPU 支持,并能有效降低开发和部署 AI 模型的门槛。用户只需在创建 Gradio 空间时选择 ZeroGPU 硬件,并使用 `@spaces.GPU` 装饰器标记 GPU 相关函数即可。ZeroGPU 与 PyTorch 兼容,并针对 Hugging Face 的 transformers 和 diffusers 库进行了优化,但目前仅限于 Gradio SDK。个人账户(PRO 用户)最多可创建 10 个 ZeroGPU 空间,组织账户(企业版)最多可创建 50 个。

AI赋能:新型蛋白质设计工具问世

2024-12-15

科学家们开发出一种利用人工智能设计全新蛋白质的工具,该工具名为RoseTTAFold,它能根据用户设定的目标结构预测蛋白质的氨基酸序列,并能生成稳定且功能强大的蛋白质。这项突破将加速新药研发、材料科学以及生物工程等领域的发展,为解决诸多人类面临的挑战提供新的可能性。这项技术有望革新生物医药领域,创造出具有特定功能的蛋白质,用于治疗疾病或开发新型材料。

进化论的哲学死胡同:对达尔文主义的反思

2024-12-15
进化论的哲学死胡同:对达尔文主义的反思

本文评论了理查德·道金斯的新书《基因的死亡之书》和萨拉·伊玛丽·沃克的《无人知晓的生命:生命的物理起源》。道金斯延续了他“自私的基因”理论,认为基因是进化的核心驱动力。然而,评论指出,这一观点已过时,未能充分考虑发育、表观遗传学、生态位构建等因素。沃克的书则试图从组装理论的角度解释生命起源,但评论认为其过于简化,未能充分阐明生命的本质。文章最终指出,流行的科学书籍往往倾向于简单化叙事,而忽略了生物学领域的复杂性和多样性。

AI

薛定谔的猫与海森堡的界限:量子力学的悖论与解释

2024-12-15
薛定谔的猫与海森堡的界限:量子力学的悖论与解释

本文探讨了薛定谔的猫的思想实验及其在流行文化中的影响。薛定谔提出该实验是为了揭示量子力学中叠加态的荒谬性,并非暗示猫同时处于死活两种状态。文章进一步解释了海森堡的界限——量子力学与经典物理学的分界点,以及不同解释(如哥本哈根诠释)对这一界限的理解。作者最终指出,量子力学是一个有效的概率计算框架,但其在宏观世界的适用性仍需进一步研究。

AI交互新范式:模型即电脑

2024-12-15

文章探讨了AI交互方式的未来,提出将大型语言模型(LLM)视为“电脑应用”而非“人”的新范式。作者认为,当前将LLM拟人化的交互方式效率低下,限制了其潜力。他建议LLM应生成图形化界面,而非简单的文本对话,这将提升交互效率、可发现性,并允许用户直接操作,如同使用电脑应用一样。这种“模型即电脑”的范式将改变人机交互方式,并带来全新的应用体验,例如动态生成适应用户需求的界面,甚至可能取代操作系统。文章列举了一些现有技术雏形,并展望了未来发展方向。

Ente照片应用:本地机器学习保障用户隐私

2024-12-15
Ente照片应用:本地机器学习保障用户隐私

Ente照片应用采用独特的本地机器学习技术,在用户设备上运行模型,而非云端,从而确保用户照片的端到端加密和隐私安全。该技术克服了计算能力有限、平台多样化以及ML库访问受限等挑战,实现了照片索引、聚类、语义搜索和人脸识别等功能。虽然本地处理会带来一些技术难题,但Ente通过优化模型、算法和图像处理流程,并利用ONNX Runtime等开源工具,最终实现了跨平台一致且高效的体验,让用户可以安全地探索和管理个人回忆。

1 2 44 45 46 47 48 49 51