Webtagr - 科技资讯摘要

Python 库的那些不常见用法

2025-07-07

本文作者通过阅读多个常用 Python 包，总结了一些不为人知的 Python 用法。例如，在基类中使用 `super()` 可以实现协作式多重继承；Mixin 类用于提供可重用的方法实现，避免基类臃肿；相对导入确保优先搜索当前包；`__init__.py` 文件不仅可以标记目录为 Python 包，还可以简化 API 或初始化日志；`conftest.py` 文件除了提供 fixture，还可以帮助 pytest 识别模块；此外，阅读库的设计文档也能帮助我们理解其设计理念。

(eugeneyan.com)

开发

LLM如何革新推荐系统和搜索引擎？

2025-03-23

本文总结了近期将大型语言模型（LLM）应用于推荐系统和搜索引擎的最新研究。这些研究探索了多种方法，例如使用LLM增强模型架构（例如YouTube的Semantic IDs和Kuaishou的M3CSR），利用LLM生成和分析数据（例如Bing的推荐质量改进和Indeed的预期不良匹配），以及采用LLM的训练方法（例如缩放定律、迁移学习和知识蒸馏）。此外，研究还关注统一搜索和推荐系统架构，例如LinkedIn的360Brew和Netflix的UniCoRn，以提高效率和性能。总的来说，这些研究表明LLM在提升推荐系统和搜索引擎的性能方面具有巨大潜力，并取得了显著的实际效果。

(eugeneyan.com)

AI

特定任务大语言模型评估的有效方法与无效方法

2024-12-09

本文探讨了针对分类/提取、摘要和翻译等常见任务的大语言模型评估方法。作者指出，现成的评估方法通常与特定应用的性能关联性较弱，缺乏区分度。文章详细介绍了分类任务中的召回率、精确率、ROC-AUC、PR-AUC以及分布分离等指标，并阐述了如何通过自然语言推理（NLI）模型、奖励模型和长度检查来评估摘要任务。此外，文章还讨论了使用chrF、BLEURT、COMET和COMETKiwi等指标评估翻译质量，以及如何衡量版权抄袭和毒性。最后，作者强调了人工评估的重要性，并建议根据风险级别调整评估标准。

(eugeneyan.com)

151

未分类

我们从一年的LLM开发中学到了什么

2024-06-01

文章总结了六位来自不同背景的专家在过去一年中构建基于LLM的真实世界应用程序所获得的经验教训。文章分为战术、运营和战略三个部分，详细探讨了与LLM工作相关的各个方面，包括提示技巧、评估策略、检索增强生成、工作流程优化、数据处理、模型选择、产品设计、团队角色以及长期业务策略等。文章强调了理解LLM工作原理、关注数据质量、注重评估和监控、优先考虑产品需求以及团队协作的重要性，并提供了许多实用建议和真实案例。

(eugeneyan.com)

55

未分类

简洁性是优势，但复杂性更畅销

2024-05-05

文章探讨了简洁性与复杂性之间的矛盾，指出尽管简洁性是优势，但在现实中复杂性更容易获得认可和回报。作者分析了复杂性更受欢迎的原因，包括它暗示着努力、掌握和创新，并能提供更多功能。然而，作者也强调了简洁性的优点，如易于理解、使用、构建和维护，以及更低的运营成本。文章建议以尽可能简单的方案解决复杂问题，并引用奥卡姆剃刀原理，即最简单的解释通常是正确的。

(eugeneyan.com)

55

未分类简单复杂性正念简洁性奥卡姆剃刀