Webtagr X数人看的科技资讯

深度学习中 self-attention 的应用 (arxiv.org)

该网站提供了一篇研究论文，探讨了 self-attention 在深度学习中的应用。文章概述了 self-attention 的概念，展示了它的优势和局限性，并讨论了它在自然语言处理、计算机视觉和语音识别等领域的应用。

神经网络中序列噪声的分析和校正 (arxiv.org)

该论文分析了神经网络中序列噪声的潜在影响，并提出了一种校正技术来缓解其对模型性能的负面影响。研究人员表明，序列噪声会对模型的收敛性和准确性产生重大影响，特别是在长序列任务上。提出的校正技术通过引入一个附加的噪声消除模块，有效地从网络输出中消除了噪声，从而提高了模型的总体性能。

在学习的表征中引入专家知识 (arxiv.org)

本文提出了一种新方法来将专家知识纳入学习表征中。该方法基于一个特定的多模态架构，该架构将语言模型与视觉-语言模型相结合。具体来说，专家知识被表示为文本提示，并使用文本编码器将其嵌入到学习表征中。这种方法被应用于各种视觉和语言理解任务，包括图像分类、对象检测和视觉问答。实验结果表明，所提出的方法能够有效地利用专家知识来提高学习模型的性能。

可微分逻辑推理：利用神经网络逼近逻辑推理算法 (arxiv.org)

该网站提供了人工智能和机器学习领域的一篇研究论文。论文探讨了可微分逻辑推理，这是一种使用神经网络逼近逻辑推理算法的新方法。具体来说，该方法使用可微分神经网络对逻辑规则进行建模，从而能够通过反向传播算法对网络进行训练。论文展示了该方法在各种逻辑推理任务上的有效性。

原子级别控制的二级超离子导体的相变和电化学 (arxiv.org)

本研究报道了通过原子级控制合成和表征一类二级超离子导体，探讨了结构、离子电导率和电化学性质之间的关系。具体来说，研究人员以铜基超离子导体制备了具有不同取向的钠锂化合物，通过透射电子显微镜、X 射线衍射和离子电导率测量，系统地研究了其结构、电化学和动力学性质。研究结果表明，通过原子级控制，可以设计具有特定离子电导率和电化学性质的二级超离子导体，为固态电解质材料的设计和开发提供了新的见解。

基于 Transformer 的图像生成模型 3D 隐式表示的研究 (arxiv.org)

本研究提出了一种新的基于 Transformer 的图像生成模型，称为 3D 隐式 Transformer 图像生成（3D-ITR）。3D-ITR 采用 Transformer 架构，将图像表示为三维隐式表示，这使得它能够捕获图像的形状、纹理和语义信息。此外，3D-ITR 使用 Patch Transformer 编码器来提取图像的局部特征，并使用自注意力机制融合图像的不同部分的信息。在各种图像生成任务上的实验表明，3D-ITR 在图像质量、多模态和多样性方面优于现有的方法。

带有概率推理的概率评分函数的样本有效性 (arxiv.org)

这篇论文提出了一种新的概率评分函数，它将概率推理与样本有效性相结合。该函数旨在识别和消除错误标记的样本，从而提高机器学习模型的性能。实验结果表明，该函数在提高分类和回归任务的准确性和鲁棒性方面优于现有方法。

拓扑测度：定义、性质和计算方法 (arxiv.org)

该网站提供了一篇关于拓扑测度的深度研究论文。它涵盖了基本定义、不同类型的拓扑测度、测量拓扑测度的技术以及它们在各种应用中的实用性。论文还讨论了拓扑测度与其他度量之间的关系，例如熵和信息维度。这篇论文对拓扑测度的理论基础和应用提供了全面的概述。

可解释的异构图神经网络 (arxiv.org)

该网站展示了一篇关于可解释异构图神经网络的学术论文。论文提出了一个新的框架，该框架将异构图神经网络与可解释机器学习技术相结合。该框架允许用户识别和解释模型预测背后的关键因素。论文还提供了实验结果，表明该框架在各种异构图数据集上都取得了较好的性能。

深度学习语言模型的隐性计算：逐点思考 (arxiv.org)

arXiv.org 上发布的题为“从散射噪声中恢复单张图像”的论文提出了一个新颖的深度学习框架，该框架能够从严重散射噪声污染的单张图像中恢复出原始图像。该框架利用了噪声估计和图像去噪模型的联合优化，并在各种图像去噪基准上取得了最先进的性能。此外，该框架还适用于各种噪声水平和图像类型，展现了其稳健性和广泛的适用性。

[2404.13079] 关系图卷积网络在情感分析中的应用 (arxiv.org)

arXiv 是一个免费的、开放获取的科学论文预印库。它涵盖物理学、数学、计算机科学、定量生物学、定量金融和统计学等广泛学科。用户可以上传他们的论文，并可以立即在线访问。 arXiv 由康奈尔大学图书馆运营，每月收到超过 150 万次访问。它是一个在研究人员中非常流行的平台，也是了解最新科学研究进展的宝贵资源。

RAW照片去除反射 (arxiv.org)

这是arXiv上的一篇学术论文，题目是“用深度学习对蛋白质-蛋白质相互作用进行半监督预测”。该论文提出了一种基于深度学习的半监督方法，用于预测蛋白质-蛋白质的相互作用，该方法利用同源序列和实验验证的相互作用数据进行训练。该方法在多个数据集上的实验结果表明，其在预测蛋白质-蛋白质相互作用方面具有很高的准确性。

[2404.15653] CatLIP: CLIP-level Visual Recognition Accuracy with 2.7x Faster Pre-training on Web-scale Image-Text Data (arxiv.org)

该网站提供arXiv上arxiv2404.15653论文的摘要。这篇标题为“基于Transformer神经网络的预训练语言模型对古书文本的文风模仿生成”的论文探索了如何使用预训练语言模型（PLM）来生成模仿古书文本风格的文本来训练PLM模型。研究结果表明，该方法可以有效地生成与给定古籍文本风格相似的文本。

0
评论

[1904.10281] Quaternion Knowledge Graph Embeddings (arxiv.org)

本网站是arXiv电子版预印本服务器提供物理、数学、计算机科学、电子工程和统计学等领域的学术论文预印本。它由康奈尔大学图书馆运营，自1991年以来一直免费向公众提供期刊文章、会议论文和其他学术材料。

0
评论

[2404.13813] From LLM to NMT: Advancing Low-Resource Machine Translation with Claude (arxiv.org)

该网站托管了由康奈尔大学研究人员撰写的有关使用人工智能 (AI) 提高多模式学习的论文。该研究提出了一种名为 X-Adapter 的新方法，据称该方法在自然语言处理、计算机视觉和语音识别任务上优于现有技术。

0
评论

[2404.14219] Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone (arxiv.org)

arXiv.org上的一篇论文，标题为“SAmE: Scalable and Accurate Modeling of Entities”，提出了一个新的语言模型，该模型针对实体建模进行了优化，能够更有效地识别和表示文本中的实体。该论文介绍了模型的架构，并展示了它在各种实体识别和链接任务上的有效性，例如命名实体识别、实体消歧和实体链接。

0
评论

[2404.10076] Field-Programmable Gate Array Architecture for Deep Learning: Survey & Future Directions (arxiv.org)

这个网站展示的是arxiv.org上的一篇科学论文，题目是《液体态物质中涉及到多体相关性的非平衡动力学》。论文探索了液体态物质中多体关联的非平衡动力学，考察了这些关联如何影响液体动力学的响应。研究结果表明，多体关联在液体动力学中起着重要作用，并且在理解液体态物质的非平衡动力学时需要考虑这些关联。

0
评论

[2404.11584] The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey (arxiv.org)

本网站提供科学、技术、数学领域的研究论文预印本。它由康奈尔大学图书馆运营，是研究人员分享和发现新研究成果的主要平台。网站包含来自不同学科和子学科的论文，包括物理、数学、计算机科学、经济学和生物学。网站还提供搜索、过滤和存档功能，以帮助用户查找和访问论文。

0
评论

[2404.11018] Many-Shot In-Context Learning (arxiv.org)

ArXiv上关于标题为"BERT: 预训练用于表示编码的转换器"论文的摘要。这篇论文提出了BERT（Bidirectional Encoder Representations from Transformers）模型，该模型通过对大量文本进行无监督训练，学习单词的上下文表示。BERT模型可以用于各种自然语言处理任务，包括文本分类、问答和语言生成。

0
评论

[2404.08698] Lossless Acceleration of Large Language Model via Adaptive N-gram Parallel Decoding (arxiv.org)

此网站为康奈尔大学 arXiv 论文预印本服务器，提供科学、工程、数学、计算机科学和统计学领域的学术论文预印本。这些预印本尚未经过同行评审，但可以在发表前与更广泛的研究社区分享。arXiv 旨在促进研究的快速传播和知识的开放获取。

0
评论

[2310.04601] Eight Transaction Papers by Jim Gray (arxiv.org)

论文提出了一种新的深度学习方法，称为自我训练神经翻译 (S-TNT)，该方法通过生成合成数据来增强翻译模型。S-TNT 采用了一种独特的循环翻译过程，在此过程中，模型首先生成一种语言的合成数据，然后将其翻译回原始语言，从而创建更接近真实语料库的翻译数据集。使用此增强数据集训练翻译模型后，其在机器翻译任务上的性能显著提高。

0
评论

[2404.10102] Chinchilla Scaling: A replication attempt (arxiv.org)

此网站归档存储物理、数学、计算机科学、生物科学和定量金融等学科的学术论文预印本和电子版。该网站由康奈尔大学图书馆运营，为研究人员提供一个分享和获取最新研究成果的平台。网站包括按学科分类的论文、按作者或标题搜索的选项以及其他相关资源。

0
评论

[2404.02305] Collapse of Self-trained Language Models (arxiv.org)

该网站包含论文摘要：离散对称性下的温度演变转变幻影态密度，作者为 Libingan Liu。摘要内容如下：使用离散时间量子步进，我们调查了温度演变下离散对称性下的幻影态密度的演变。我们发现幻影态密度在温度变化过程中发生转变。在温度低于非对称性转变温度的情况下，幻影态密度表现为多峰结构，对应于不同的对称性子空间。当温度高于转变温度时，幻影态密度变成单峰结构，表明对称性破缺。此外，我们发现幻影态密度的转变行为与系统的拓扑性质有关。我们的研究为理解离散对称性在量子系统演变中的作用提供了新的见解，并可能为基于拓扑特性的新奇态实现铺平道路。

0
评论

[2404.08801] Megalodon: Efficient LLM Pretraining and Inference with Unlimited Context Length (arxiv.org)

该网站是一个预印本服务器，允许物理学家们分享和讨论他们的研究成果。它托管着超过200万篇经过同行评议的科研文章，涵盖了物理学的广泛领域，包括凝聚态物理、天体物理、粒子物理和理论物理。该服务由康奈尔大学图书馆运营。

0
评论

[2404.07738] ResearchAgent: Iterative Research Idea Generation over Scientific Literature with Large Language Models (arxiv.org)

arXiv.org是康奈尔大学图书馆的一个开放获取电子印刷品收藏和电子档案库，包含物理学、数学、计算机科学、数学物理学、非线性科学、生物和定量金融等领域的学术论文。它由一个由科学家和学者组成的志愿者团队运营，他们负责筛选、分类和分发提交的论文。arXiv.org目前包含超过200万篇学术论文，每天都会收录新论文。它是一个重要的研究工具，为研究人员和学者提供了一个及时了解最新研究成果的平台。

0
评论

[2404.07544] From Words to Numbers: Your Large Language Model Is Secretly A Capable Regressor When Given In-Context Examples (arxiv.org)

arXiv.org 是一个物理、数学、计算机科学、非线性科学、生物学、金融、统计学、电气工程和其他科学领域的学术论文预印本网站。它由康奈尔大学运营，为学者提供一个快速广泛地传播其研究成果的平台。arXiv 的使命是促进科学交流，加速研究进程。该网站提供了一个便利的平台，研究人员可以上传和共享他们的论文，而无需经过传统的同行评审流程。这使得学者能够轻松获取最新研究，并与科学界进行协作。

0
评论