本文介绍了 CookingSense,这是一个从网络数据、科学论文和食谱等各种来源提取的烹饪领域知识断言的描述性集合,从中获得了涵盖广泛方面的知识。CookingSense 通过一系列基于字典的过滤和基于语言模型的语义过滤技术构建,从而形成了一个丰富的多学科食品相关断言知识库。此外,我们还提出了 FoodBench,这是一个用于评估烹饪决策支持系统的新颖基准。通过 FoodBench 的评估,我们凭经验证明 CookingSense 提高了检索增强语言模型的性能。我们还通过定性分析验证了 CookingSense 中断言的质量和多样性。
本文介绍了如何利用 AMD Instinct™ MI300A 的统一内存和 OpenMP 5.2 标准将高性能计算 (HPC) 应用程序移植到该平台。文章重点介绍了统一内存架构的优势,包括简化数据管理、提升开发效率以及与 OpenMP 的良好兼容性。文章以 OpenFOAM 软件为例,展示了如何利用 OpenMP 指令轻松地将完整应用程序卸载到 MI300A APU 上。
大型语言模型 (LLM) 在处理结构化数据方面能力不足,例如,ChatGPT 在结构化知识基础 (SKG) 方面的表现落后于最先进 (SoTA) 模型平均 35%。为了增强 LLM 的 SKG 能力,研究人员开发了一个包含 110 万个示例的指令调整数据集,并基于 Mistral 和 CodeLlama 模型系列训练了一系列名为 StructLM 的模型,参数范围从 70 亿到 340 亿不等。StructLM 系列在 18 个评估数据集中有 16 个超过了特定任务模型,并在 8 个 SKG 任务上建立了新的 SoTA 性能。
本研究提出了一种新的基于 Transformer 的图像生成模型,称为 3D 隐式 Transformer 图像生成(3D-ITR)。3D-ITR 采用 Transformer 架构,将图像表示为三维隐式表示,这使得它能够捕获图像的形 状、纹理和语义信息。此外,3D-ITR 使用 Patch Transformer 编码器来提取图像的局部特征,并使用自注意力机制融合图像的不同部分的信息。在各种图像生成任务上的实验表明,3D-ITR 在图像质量、多模态和多样性方面优于现有的方法。
大型语言模型 (LLM) 的快速发展已经超过了我们准确评估其质量的能力。为了解决这个问题,许多评估现在依赖于使用 LLM 本身作为评判者来对其他 LLM 输出的质量进行评分,通常使用像 GPT4 这样的大型模型。然而,这种方法成本高昂,并且已被证明会引入模型内偏差。本文提出了一种使用 LLM 评估者小组 (PoLL) 来评估模型的方法。研究发现,使用由大量较小模型组成的 PoLL 比使用单个大型评判者表现更好,由于其由不相交的模型家族组成,因此表现出更少的模型内偏差,而且成本降低了七倍多。
这篇论文介绍了 RAGCache,一种专为检索增强生成(RAG)量身定制的多级动态缓存系统。RAGCache 旨在解决 RAG 系统中因知识注入导致的长序列生成问题,从而降低计算和内存成本。该系统通过在知识树中组织检索到的知识的中间状态,并将它们缓存到 GPU 和主机内存层次结构中来实现这一点。RAGCache 提出了一种替代策略,它了解 LLM 推理特征和 RAG 检索模式,并动态重叠检索和推理步骤,以最大程度地减少端到端延迟。实验结果表明,与 vLLM 集成 Faiss 相比,RAGCache 将首个令牌时间 (TTFT) 缩短了 4 倍,并将吞吐量提高了 2.1 倍。
本文介绍了一种从消费者照片中去除真实世界反射的系统。该系统在线性(RAW)照片上运行,可以选择添加一张朝向相反方向的上下文照片,例如使用移动设备上的自拍相机,这有助于消除歧义,确定应该被视为反射的内容。该系统使用真实世界RAW图像的合成混合进行训练,这些图像使用光度和几何上精确的反射模拟进行组合。
该网站提供arXiv上arxiv2404.15653论文的摘要。这篇标题为“基于Transformer神经网络的预训练语言模型对古书文本的文风模仿生成”的论文探索了如何使用预训练语言模型(PLM)来生成模仿古书文本风格的文本来训练PLM模型。研究结果表明,该方法可以有效地生成与给定古籍文本风格相似的文本。
本网站是arXiv电子版预印本服务器提供物理、数学、计算机科学、电子工程和统计学等领域的学术论文预印本。它由康奈尔大学图书馆运营,自1991年以来一直免费向公众提供期刊文章、会议论文和其他学术材料。
该网站托管了由康奈尔大学研究人员撰写的有关使用人工智能 (AI) 提高多模式学习的论文。该研究提出了一种名为 X-Adapter 的新方法,据称该方法在自然语言处理、计算机视觉和语音识别任务上优于现有技术。
arXiv.org上的一篇论文,标题为“SAmE: Scalable and Accurate Modeling of Entities”,提出了一个新的语言模型,该模型针对实体建模进行了优化,能够更有效地识别和表示文本中的实体。该论文介绍了模型的架构,并展示了它在各种实体识别和链接任务上的有效性,例如命名实体识别、实体消歧和实体链接。
这个网站展示的是arxiv.org上的一篇科学论文,题目是《液体态物质中涉及到多体相关性的非平衡动力学》。论文探索了液体态物质中多体关联的非平衡动力学,考察了这些关联如何影响液体动力学的响应。研究结果表明,多体关联在液体动力学中起着重要作用,并且在理解液体态物质的非平衡动力学时需要考虑这些关联。
本网站提供科学、技术、数学领域的研究论文预印本。它由康奈尔大学图书馆运营,是研究人员分享和发现新研究成果的主要平台。网站包含来自不同学科和子学科的论文,包括物理、数学、计算机科学、经济学和生物学。网站还提供搜索、过滤和存档功能,以帮助用户查找和访问论文。
ArXiv上关于标题为"BERT: 预训练用于表示编码的转换器"论文的摘要。这篇论文提出了BERT(Bidirectional Encoder Representations from Transformers)模型,该模型通过对大量文本进行无监督训练,学习单词的上下文表示。BERT模型可以用于各种自然语言处理任务,包括文本分类、问答和语言生成。
此网站为康奈尔大学 arXiv 论文预印本服务器,提供科学、工程、数学、计算机科学和统计学领域的学术论文预印本。这些预印本尚未经过同行评审,但可以在发表前与更广泛的研究社区分享。arXiv 旨在促进研究的快速传播和知识的开放获取。
论文提出了一种新的深度学习方法,称为自我训练神经翻译 (S-TNT),该方法通过生成合成数据来增强翻译模型。S-TNT 采用了一种独特的循环翻译过程,在此过程中,模型首先生成一种语言的合成数据,然后将其翻译回原始语言,从而创建更接近真实语料库的翻译数据集。使用此增强数据集训练翻译模型后,其在机器翻译任务上的性能显著提高。
此网站归档存储物理、数学、计算机科学、生物科学和定量金融等学科的学术论文预印本和电子版。该网站由康奈尔大学图书馆运营,为研究人员提供一个分享和获取最新研究成果的平台。网站包括按学科分类的论文、按作者或标题搜索的选项以及其他相关资源。
该网站包含论文摘要: 离散对称性下的温度演变转变幻影态密度,作者为 Libingan Liu。摘要内容如下:使用离散时间量子步进,我们调查了温度演变下离散对称性下的幻影态密度的演变。我们发现幻影态密度在温度变化过程中发生转变。在温度低于非对称性转变温度的情况下,幻影态密度表现为多峰结构,对应于不同的对称性子空间。当温度高于转变温度时,幻影态密度变成单峰结构,表明对称性破缺。此外,我们发现幻影态密度的转变行为与系统的拓扑性质有关。我们的研究为理解离散对称性在量子系统演变中的作用提供了新的见解,并可能为基于拓扑特性的新奇态实现铺平道路。
该网站是一个预印本服务器,允许物理学家们分享和讨论他们的研究成果。它托管着超过200万篇经过同行评议的科研文章,涵盖了物理学的广泛领域,包括凝聚态物理、天体物理、粒子物理和理论物理。该服务由康奈尔大学图书馆运营。
arXiv.org是康奈尔大学图书馆的一个开放获取电子印刷品收藏和电子档案库,包含物理学、数学、计算机科学、数学物理学、非线性科学、生物和定量金融等领域的学术论文。它由一个由科学家和学者组成的志愿者团队运营,他们负责筛选、分类和分发提交的论文。arXiv.org目前包含超过200万篇学术论文,每天都会收录新论文。它是一个重要的研究工具,为研究人员和学者提供了一个及时了解最新研究成果的平台。
这篇论文分析了预训练的大型语言模型(如Llama2、GPT-4、Claude 3等)在给定上下文示例的情况下,进行线性回归和非线性回归的能力,而无需任何额外的训练或梯度更新。研究发现,一些大型语言模型(例如GPT-4、Claude 3)能够执行回归任务,其性能可与传统的监督方法(如随机森林、Bagging或梯度提升)相媲美,甚至超越后者。