用陪审团取代法官:用多样化模型面板评估LLM生成

2024-04-30

大型语言模型 (LLM) 的快速发展已经超过了我们准确评估其质量的能力。为了解决这个问题,许多评估现在依赖于使用 LLM 本身作为评判者来对其他 LLM 输出的质量进行评分,通常使用像 GPT4 这样的大型模型。然而,这种方法成本高昂,并且已被证明会引入模型内偏差。本文提出了一种使用 LLM 评估者小组 (PoLL) 来评估模型的方法。研究发现,使用由大量较小模型组成的 PoLL 比使用单个大型评判者表现更好,由于其由不相交的模型家族组成,因此表现出更少的模型内偏差,而且成本降低了七倍多。

阅读更多
41

联邦通信委员会平价连接计划将于今年结束

2024-04-30

美国联邦通信委员会(FCC)宣布其平价连接计划(Affordable Connectivity Program)将于今年晚些时候结束。这项计划为低收入家庭提供互联网服务补贴,自2021年启动以来,已惠及数百万美国人。FCC表示,该计划的资金已经用完,将无法继续提供补贴。该公告可能会对许多依靠该计划获得互联网服务的家庭产生重大影响。

阅读更多

浙江大学计算机视觉实验室

2024-04-30

浙江大学计算机视觉实验室(LoG)是一个活跃在计算机视觉领域的研究团队,以其在图像理解、视频分析和计算机图形学方面的工作而闻名。该实验室由吴健担任主任,其成员包括经验丰富的教授、研究人员和学生。LoG实验室致力于通过将传统计算机视觉技术与深度学习、大数据和云计算等新兴技术相结合,推动计算机视觉领域的发展。该实验室已与国内外多个企业和学术机构建立了合作关系,其研究成果发表在国际顶级期刊和会议上。

阅读更多
未分类 浙江大学 吴健

LLama3 梯度

2024-04-30

该网站引导用户访问 LLaMA3 梯度,LLaMa3 梯度是 OpenAI 开发的多模态人工智能模型。该网站提供了有关如何访问该模型以及如何使用提示工程来使用其功能的信息。此外,该网站还提供了一个论坛,用户可以在其中讨论该模型并分享他们的经验。

阅读更多
41
未分类 LLaMA LLaMA3

CLIPS语言之旅

2024-04-30

本文介绍了CLIPS编程语言,CLIPS是由NASA开发的一种基于规则的编程语言,它使用Rete算法来确定规则的执行顺序,并缓存常用的计算结果。文章详细介绍了CLIPS的语法、规则、事实、函数和模板等概念,并通过示例代码演示了如何使用CLIPS编写程序,处理用户输入,以及控制规则的执行顺序等。

阅读更多
38

PCIe 5.0 问世已四年,但对于游戏 PC 来说仍几乎毫无价值

2024-04-30

这篇文章探讨了 PCIe 5.0 技术在游戏 PC 中的现状,指出该技术已推出四年,但由于缺乏兼容设备和明显的好处,对于游戏玩家来说仍基本上毫无价值。作者认为,PCIe 5.0 在游戏 PC 中的广泛采用可能需要更长的时间,并强调了 PCIe 4.0 在当前和未来游戏中的充分性。

阅读更多

加州的新人工智能法案

2024-04-30

这篇文章讨论了加州的新人工智能法案,该法案对人工智能的使用施加了新的限制。该法案禁止使用人工智能进行面部识别,并要求披露该技术的使用。作者认为,该法案是人工智能监管朝着正确方向迈出的一步,但仍有改进的空间。

阅读更多
未分类 法案

从工程师到全职艺术家的转型

2024-04-30

本文讲述了巴勃罗·阿佐卡尔从工程师转型为艺术家的历程。巴勃罗曾是一名工程师,热爱摄影和极限运动,后因疫情影响,转向利用机械臂进行艺术创作并取得成功。文章详细介绍了巴勃罗的创作历程、经营理念和成功经验,包括立即行动、持续营销、简化购买流程、扩大市场、注重质量等,并鼓励艺术家创建邮件列表以提升客户留存和平台独立性。

阅读更多

亏损科技公司将为借贷的数十亿美元买单

2024-04-30

该文章讨论了处于亏损状态的科技公司所面临的财务困境。这些公司在低利率环境下借了数十亿美元,如今利率上升,经济放缓,它们发现很难偿还债务。文章指出,一些公司可能会被迫出售资产或进行裁员以维持运营。作者认为,随着科技行业进入更具挑战性的时期,这些公司将面临艰难的选择。

阅读更多
未分类 债务

LMSYS Chatbot Arena:实时和社区驱动的LLM评估

2024-04-30

LMSYS Chatbot Arena是一个开源项目,旨在通过实时、开放和社区驱动的评估来推进LLM的发展和理解。该平台允许用户通过在实际用例中的成对比较来评价LLM,并定期发布排行榜。自2023年5月推出以来,Chatbot Arena已成为一个重要的LLM评估平台,吸引了数百万参与者,收集了超过80万张投票,用于评估90多个LLM。该项目致力于开放科学,分享用户偏好数据和一百万个用户提示,支持研究和模型改进。

阅读更多
42

足够好即足够好

2024-04-30

此网站包含在 2013 年欧洲 Python 会议上的一场名为“足够好即足够好”的演讲。演讲者是 Robert Smallshire,他讨论了在编写代码时何时足够好,以及如何平衡速度和质量。演讲者还提供了如何判断代码何时足够好的技巧和建议。

阅读更多
未分类 python 代码质量

医疗保健公司联合健康集团和 Change Healthcare 因勒索软件攻击而泄露数据

2024-04-30

知名医疗保健公司联合健康集团 (UHG) 和 Change Healthcare 近日遭受了一次勒索软件攻击,导致大量患者数据被泄露。攻击者利用被盗的登录凭证绕过了多因素身份验证 (MFA),访问了敏感信息,包括姓名、地址、社会安全号码和医疗记录。两家公司目前正在调查该事件,并已通知受影响的个人。

阅读更多
未分类 勒索软件

Kedify 宣布其功能强大的 KEDA 驱动公共测试版正式启动

2024-04-30

该博文宣布 Kedify 公测版的正式启动,Kedify 是一款由 KEDA 驱动的事件驱动的无服务器平台。该平台为企业提供了打造和部署无服务器应用程序所需的工具和资源。它提供各种功能,包括自动弹性扩展、无服务器计算、与 KEDA 的无缝集成以及对云原生技术的支持。该平台旨在帮助企业通过提高敏捷性、降低成本和简化运营来实现数字化转型。

阅读更多
62
未分类 KEDA 云原生

FFmepg协议

2024-04-30

ffs协议(FFmpeg流式服务)是一个针对媒体流传输优化的HTTP流式传输协议。它专为嵌入式平台和流媒体设备设计,提供低延迟、高吞吐量和低功耗的流传输体验。ffs协议基于FFmpeg库,使用WebSockets进行通信,并支持HTTP/2和FLV格式的流媒体。

阅读更多
未分类 FFmpeg

材料分析受益于电子探针的新功能

2024-04-30

该网站报道了电子探针分析技术的最新进展,包括提高空间分辨率和灵敏度,以及对各种材料进行定量分析的能力。这些进展使电子探针成为一种强大的工具,用于研究材料的微观结构和化学成分,并了解其性能与结构之间的关系。文章还讨论了电子探针在半导体元件、燃料电池和生物材料等领域中的潜在应用。

阅读更多
44

Cressi Nepto:用于次表面检测的新型水下金属探测器

2024-04-30

Cressi Nepto 是一款用于水下次表面检测的新型水下金属探测器。它由 Cressi Sub 研发,具有多种令人印象深刻的功能,使其非常适合各种水下探索活动。Nepto 采用创新技术,例如脉冲感应 (PI) 和高频 (HF) 同时传输和接收,以实现最佳灵敏度和深度渗透。它还配备了一个大型同轴搜索线圈,可提供出色的覆盖范围和信号稳定性,即使在具有挑战性的环境中也是如此。Nepto 的设计轻巧且符合人体工程学,使其易于使用和操作,即使在长时间的潜水过程中也是如此。它还具有防水等级 IP68,使其耐用且可靠,适合在各种水下条件下使用。这款金属探测器也非常适合寻找宝藏、文物的寻回和一般水下探索。

阅读更多

能否对整个网络进行检索增强生成?

2024-04-30

本文探讨了使用检索增强生成 (RAG) 技术对整个网络进行矢量化的可行性。作者提出了一种基于 SQLite 数据库和 XML 网站地图的去中心化方法,允许网站所有者共享其内容和嵌入向量,从而使大型语言模型能够按需查询特定领域,而无需进行大量抓取。作者还开发了一个 Python 库,用于从网站地图创建内容数据库,并使用 sqlite-vss 扩展实现向量相似性搜索。

阅读更多

Pydantic Logfire:简化可观测性

2024-04-30

Pydantic Logfire是一个新的可观测性平台,由Pydantic团队打造,旨在简化应用程序行为的监控。它提供对Python应用程序的全面了解,从请求头和正文到程序执行的完整跟踪。Logfire建立在OpenTelemetry之上,支持流行的Python包的自动检测,并提供结构化数据和直接SQL访问,以便于查询和分析。

阅读更多

Spotify 面向艺人的外观模式应用

2024-04-30

本文介绍了 Spotify 如何将外观模式应用到面向艺人的音乐发布方式中。外观模式简化了多层复杂系统的访问,并允许系统以统一的方式与多种子系统进行交互。在 Spotify 的例子中,外观模式被用来组织和抽象与音乐发布相关的各种服务,例如元数据管理、发行和分发。这使得 Spotify 能够简化面向艺人的音乐发布过程,并为他们提供更无缝和一致的体验。

阅读更多

深度学习入门书籍:爱丽丝漫游可微仙境

2024-04-30

《爱丽丝漫游可微仙境》是一本面向深度学习入门者的书籍,以通俗易懂的方式介绍了神经网络和可微编程的基础知识。书中涵盖了自动微分优化函数、序列、图形、文本和音频处理的常见设计,重点介绍了卷积、注意力和循环块等重要设计技术,并通过PyTorch和JAX代码示例帮助读者理解理论与实践之间的联系。

阅读更多

腕表中的日历类型

2024-04-30

这篇博客文章探讨了腕表中使用的各种日历类型,包括简单日历、年历、万年历和复杂功能。它解释了每种类型的运作方式以及它们的优缺点。文章还提供了有关如何选择适合您的腕表的日历类型的提示。

阅读更多
37
1 2 461 462 463 465 467 468 469 516 517