搜索技巧 海洋云增白 开源地图 AI 搜索答案 沙丘魔堡2 压缩机站 自由职业 policy 小团队 颈挂空调 Chumby 个人电脑 极端主义 团队 PostgreSQL AI工具 证券 DirectX DrawingPics 化学 KDE 披萨农场 多动症 植物学 分析化学 Three.js 大会 残疾人学校 初创 QB64 更多

哥德尔智能体:一种递归自我改进的自我参照智能体框架 (arxiv.org)

哥德尔智能体是一种受哥德尔机启发的自我进化框架,允许智能体在不依赖预定义例程或固定优化算法的情况下递归地改进自身。它利用大型语言模型(LLM)在高级目标的指导下,通过提示动态地修改自身的逻辑和行为。在数学推理和复杂智能体任务上的实验结果表明,哥德尔智能体的实现可以实现持续的自我改进,在性能、效率和通用性方面都超过了人工设计的智能体。

迈向人工智能数学家:机器学习与信息论的概念 (arxiv.org)

这篇论文探讨了如何利用机器学习和信息论的概念来构建人工智能数学家。文章指出,当前深度学习在直觉和习惯行为方面取得了成功,但在推理和不确定性估计方面仍有不足。文章认为,一个理想的定理体系应该简洁地概括所有可证明的陈述,并提出信息论可以用来指导发现新的数学猜想。

线性可分性边缘的顿悟 (arxiv.org)

这篇文章研究了二元逻辑分类在简化设置下的泛化特性,并从经验和分析上阐明了其动力学中顿悟的潜在机制。研究发现,当应用于接近线性可分性的训练集时,顿悟现象会被放大。即使始终存在完美的泛化解决方案,但如果训练数据与原点线性可分,则逻辑损失的隐含偏差将导致模型过度拟合。

GSM-Symbolic:理解大型语言模型在数学推理中的局限性 (arxiv.org)

大型语言模型 (LLM) 在数学推理能力方面取得了进步,但其可靠性仍存在疑问。本文针对这一问题,引入了一个名为 GSM-Symbolic 的改进基准,用于评估模型在不同难度数学问题上的表现。研究发现,LLM 在处理相同问题结构但数值不同的情况下表现出显著差异。此外,模型的数学推理能力随着问题复杂性的增加而下降,这表明当前的 LLM 可能无法进行真正的逻辑推理,而是复制训练数据中的推理步骤。

Aria:一种开放的多模态原生混合专家模型 (arxiv.org)

Aria是一种开源的多模态原生模型,在各种多模态、语言和编码任务中均表现出色。它是一个混合专家模型,每个视觉标记和文本标记分别具有39亿和35亿个激活参数,性能优于Pixtral-12B和Llama3.2-11B,并在各种多模态任务上与最好的专有多模态模型竞争。

仅需加法即可构建节能语言模型 (arxiv.org)

这篇论文介绍了一种名为L-Mul的线性复杂度乘法算法,该算法可以使用整数加法运算来逼近浮点数乘法,从而显著降低大型神经网络的计算资源消耗。与8位浮点乘法相比,L-Mul算法在实现更高精度的同时,可以将逐元素浮点张量乘法的能耗降低95%,将点积的能耗降低80%。研究人员在多个文本、视觉和符号任务上对L-Mul算法进行了评估,结果表明该算法在保持高精度的同时,能够显著降低能耗。

差分Transformer (arxiv.org)

本文介绍了差分Transformer模型,该模型通过放大对相关上下文的注意力并消除噪声来解决传统Transformer模型过度关注无关上下文的问题。差分注意力机制通过计算两个独立的softmax注意力图之间的差异来获得注意力分数,从而消除噪声并促进稀疏注意力模式的出现。在语言建模等任务上的实验结果表明,差分Transformer在模型大小和训练数据规模等方面都优于传统的Transformer模型。

Sorbet:一种与神经形态硬件兼容的基于Transformer的脉冲语言模型 (arxiv.org)

为了满足边缘设备对语言模型的需求,该文介绍了一种名为Sorbet的基于Transformer的脉冲语言模型。Sorbet针对神经形态硬件的兼容性进行了优化,采用了PTsoftmax和BSPN等创新方法,分别替代了softmax和层归一化等高能耗操作,并通过知识蒸馏和模型量化实现了高效的二进制权重模型。

前线的恐惧与厌恶:解读俄乌战争博主如何使用“异化”语言 (arxiv.org)

本文介绍了一个利用大型语言模型 (LLM) 量量化“异化”语言的计算框架,并将其应用于Telegram 战争博主和 Gab 上的政治讨论的真实数据。研究揭示了“异化”是如何在冲突期间升级、与道德语言相互作用,以及如何获得大量关注,尤其是在危机时期。

我们还需要RNN吗? (arxiv.org)

这篇论文重新审视了传统的循环神经网络(RNNs),如LSTMs和GRUs,发现通过移除其输入、遗忘和更新门中的隐藏状态依赖关系,LSTMs和GRUs不再需要BPTT,可以高效地并行训练。作者介绍了LSTMs和GRUs的最小版本(minLSTMs和minGRUs),它们使用比传统版本少得多的参数,并且在训练期间完全可并行化。最后,作者表明这些简化版的RNNs与最近的序列模型的经验性能相匹配。

TPI-LLM:在低资源边缘设备上高效服务 70B 级 LLM (arxiv.org)

TPI-LLM是一种计算和内存高效的张量并行推理系统,旨在在低资源边缘设备上高效地服务于70B级的LLM。它通过将敏感的原始数据保存在用户的设备上,并引入滑动窗口内存调度器来动态管理推理过程中的层权重,从而解决了边缘设备计算能力、内存和带宽有限的问题。TPI-LLM还通过实现基于星形的allreduce算法来缓解通信瓶颈,并通过与计算和通信重叠的磁盘I/O延迟来实现。

论文本编辑器的设计 (arxiv.org)

这篇论文探讨了文本编辑器的设计,指出开发者在布局、排版、颜色和交互方面做出的默认和隐含选择,并质疑这些选择是出于对替代方案的忽视还是出于习惯。作者试图描述这些隐含选择,并阐释一些替代方案,但没有规定哪种方案更好。

Eg-walker:更好、更快、更小的协同文本编辑算法 (arxiv.org)

Eg-walker是一种新的协同文本编辑算法,旨在解决现有OT算法和CRDT算法的不足。与CRDT相比,Eg-walker内存占用更少,加载速度更快;与OT相比,Eg-walker合并长分支的速度更快。Eg-walker适用于CRDT的各种场景,包括没有中央服务器的对等网络,为点对点协作软件的广泛应用铺平了道路。

LlamaF:嵌入式FPGA上的高效Llama2架构加速器 (arxiv.org)

文章介绍了一种名为LlamaF的FPGA加速器,旨在提升大型语言模型(LLM)在嵌入式设备上的推理性能。该加速器针对TinyLlama 1.1B模型进行了优化,采用训练后量化技术减少模型大小,并优化了片外内存带宽。通过异步计算和全流水线矩阵向量乘法器设计,LlamaF在Xilinx ZCU102平台上实现了14.3-15.8倍的加速和6.1倍的能效提升。

基于 NeRF 的特征点检测与描述 (arxiv.org)

本文提出了一种利用神经辐射场 (NeRF) 生成室内外场景数据集的新方法,用于特征点检测和描述。该方法通过透视投影几何对多视图 NeRF 合成数据进行监督训练,并在相对姿态估计、点云配准和单应性估计等标准基准测试中取得了优异性能,同时与现有方法相比,所需的训练数据和时间显著减少。

通过强化学习训练语言模型进行自我纠正 (arxiv.org)

这篇论文介绍了一种名为SCoRe的多轮在线强化学习方法,用于提高大型语言模型的自我纠正能力。研究发现,传统的监督式微调方法不足以训练出有效的自我纠正行为,因为存在训练数据和模型自身回复之间的分布不匹配问题。SCoRe通过在模型自生成的数据上进行训练并使用适当的正则化来解决这些挑战,最终显著提高了模型在MATH和HumanEval基准测试中的自我纠正性能。

CAVERNAUTE:用于洞穴探险的刚性可折叠室内飞艇空中系统的设计和制造流程 (arxiv.org)

本文介绍了一种名为 CAVERNAUTE 的新型室内飞艇设计,该设计灵感来自折纸和克雷斯林图案,用于洞穴探险。该飞艇结构结合了碳纤维外骨骼和紫外线树脂微晶格,以吸收冲击。这种设计增强了机器人的强度,同时允许通过折叠结构进入狭窄的空间,体积膨胀比高达 19.8。

大型语言模型硬件加速:综述与比较 (arxiv.org)

这篇文章综述了利用硬件加速器加速大型语言模型Transformer网络的各种研究工作,对不同技术、平台(FPGA、ASIC、内存、GPU)以及加速效果、能效、性能(GOPs)和能效比(GOPs/W)进行了定性和定量比较。文章还通过将不同方案的结果外推到相同的工艺技术上,进行了更公平的理论和实践比较。

广义卡洛斯音阶 (arxiv.org)

本文介绍了作曲家温蒂·卡洛斯在1986年提出的三种非常规音乐音阶——阿尔法、贝塔和伽马音阶,这些音阶的灵感来自十二平均律,淡化了八度音程作为主要音程的作用,而强调了大三度、小三度和纯五度的作用。文章对大卫·本森提出的阿尔法、贝塔和伽马音阶的推导进行了概括,从而产生了多种卡洛斯类型的音阶。

保持冷静:何时分布式一致性变得容易 (arxiv.org)

这篇论文介绍了CALM定理,该定理阐明了哪些程序可以进行一致的、无需协调的分布式实现。CALM代表“一致性即逻辑单调性”,该定理表明,只有那些可以用单调逻辑表示的程序才能实现一致的、无需协调的分布式实现。CALM定理为分布式应用程序的开发人员提供了理论指导,并对分布式系统设计产生影响。

更小、更弱、却更好:通过计算优化采样训练大型语言模型推理器 (arxiv.org)

这篇论文研究了在固定推理预算下,使用更强大但更昂贵的语言模型(SE)与更弱但更便宜的语言模型(WC)生成合成数据之间的权衡。研究发现,WC模型生成的数据可能具有更高的覆盖率和多样性,但也表现出更高的假阳性率。然而,在知识蒸馏、自我改进和弱到强改进设置等不同情况下,使用WC模型生成的数据微调的语言模型在多个基准测试和多个WC和SE模型选择中始终优于使用SE模型生成的数据训练的模型。

拼图游戏需要多大的桌子? (arxiv.org)

这篇文章研究了拼图游戏所需的桌子面积。作者推导出一个简单的公式,基于二维圆形堆积原理,得出结论:未组装的拼图面积是组装后拼图面积的√3倍,与拼图块数无关。作者通过对9个不同大小的拼图进行测量,验证了该公式的准确性。

辐射级联:一种用于多维非局部热力学平衡辐射传递的高分辨率形式解 (arxiv.org)

文章介绍了一种名为“辐射级联”的新技术,用于解决天体物理学中多维非局部热力学平衡辐射传递问题。该技术通过有效利用辐射场的固有结构,允许高效地重复使用计算样本,从而以比现有方法更低的计算成本提供非常高分辨率的结果。文章还描述了该方法在 DexRT 代码中的实现,并展示了对通过悬浮-凝聚形成的太阳日珥磁流体动力学模型快照进行合成的初步结果。

Sapiens:人类视觉模型的基础 (arxiv.org)

Sapiens是一系列用于人类视觉任务的模型,包括二维姿态估计、身体部位分割、深度估计和表面法线预测。这些模型在超过3亿张人类图像上进行了预训练,只需微调即可轻松适应不同的任务。Sapiens在各种人类视觉基准测试中始终优于现有模型,并在Humans-5K(姿态)、Humans-2K(部位分割)、Hi4D(深度)和THuman2(法线)等方面取得了显著的性能提升。

独特性偏差:为何重要,如何抑制 (arxiv.org)

本文探讨了“独特性偏差”,一种将决策视为独一无二的规划者和管理者倾向的行为偏差。研究首次将独特性偏差与现实世界项目投资决策中的预测准确性和绩效相关联。文章指出将项目视为独特的传统框架会导致项目绩效不佳,并通过对219个项目的样本进行测试,发现感知到的独特性与低绩效之间确实存在高度的统计学意义上的关联。最后,文章指出决策者可以通过“决策卫生”来减轻项目中的独特性偏差,特别是参考类别预测、事后分析、基于相似性的预测和噪音审计。

用遮罩和扩散模型取代相机镜头 (arxiv.org)

这篇文章介绍了一种名为DifuzCam的全新相机设计,它用遮罩和扩散模型取代了传统的相机镜头。这种设计通过预先训练的扩散模型和控制网络,从传感器捕捉到的原始数据中重建图像,从而显著减小了相机尺寸和重量,并实现了高质量成像。此外,DifuzCam还可以利用场景的文本描述来进一步增强重建效果。

树形注意力机制:面向GPU集群的长上下文注意力拓扑感知解码 (arxiv.org)

这篇论文介绍了树形注意力机制,一种在GPU集群上进行长上下文注意力计算的新方法。该方法通过将注意力计算并行化,并利用树形结构减少跨设备通信,从而显著提高了计算效率。实验结果表明,树形注意力机制比其他方法(如环形注意力机制)快8倍,同时所需的通信量更少,峰值内存占用也更低。

OpenDevin:面向人工智能软件开发人员的开放平台 (arxiv.org)

OpenDevin 是一个面向 AI 软件开发人员的开放平台,允许开发人员像人类开发者一样通过编写代码、与命令行交互和浏览网页来与世界进行交互。该平台支持新代理的实现、与沙盒环境的安全交互以执行代码、多个代理之间的协调以及评估基准的合并。

GPUDrive:百万帧率的数据驱动多智能体驾驶模拟 (arxiv.org)

GPUDrive是一个基于Madrona游戏引擎构建的GPU加速多智能体模拟器,每秒可生成超过一百万步的体验,用于研究大规模多智能体规划。它允许用户直接在C++中编写观察、奖励和动力学函数,以定义复杂、异构的智能体行为。研究表明,使用GPUDrive可以在Waymo Motion数据集的多个场景中有效地训练强化学习智能体,在几分钟内就能为单个场景生成高效的目标达成智能体,并在几小时内生成具有普遍能力的智能体。

自压缩神经网络 (arxiv.org)

本文介绍了一种名为“自压缩”的神经网络压缩方法,旨在减少神经网络的大小,从而降低其执行时间、功耗、带宽和内存占用。该方法通过一个通用损失函数来最小化网络的整体大小,同时实现两个目标:移除冗余权重和减少表示剩余权重所需的比特数。实验结果表明,该方法能够在保持浮点精度的同时,将网络的比特数减少到3%,权重数量减少到18%。

← 前页 1 3 4 5 6