Yi-1.5:性能更强的升级版Yi模型

2024-05-12
Yi-1.5:性能更强的升级版Yi模型

Yi-1.5是Yi的升级版本,经过5000亿token的高质量语料库持续预训练,并在300万个不同的微调样本上进行了微调。与Yi相比,Yi-1.5在编码、数学、推理和指令跟随能力方面表现更出色,同时仍然保持了在语言理解、常识推理和阅读理解方面的出色能力。Yi-1.5提供三种模型尺寸:34B、9B和6B。

阅读更多
96
未分类

GPU 部署

2024-05-04

GPUDeploy 是一個雲端運算平台,專為執行機器學習和深度學習工作負載而設計。它提供加速運算、儲存和網路,可協助開發人員和研究人員快速部署和擴展他們的模型。GPUDeploy 還提供一組工具和服務,例如自動擴展、效能監控和資料管理,以簡化開發流程。

阅读更多

Atkinson 抖动算法

2024-06-20

本文介绍了两种常用的图像抖动算法:Floyd-Steinberg 抖动和 Atkinson 抖动。Floyd-Steinberg 抖动算法采用误差扩散的方式,将当前像素的量化误差扩散到周围未处理的像素,从而模拟出灰度效果。Atkinson 抖动算法是 Floyd-Steinberg 算法的一种变体,它采用更广泛的误差扩散模式,并保留了四分之三的误差,能够产生更丰富的对比度。文章还介绍了如何在 iKe 软件中实现 Atkinson 抖动算法。

阅读更多
未分类 抖动

大型语言模型不适合头脑风暴

2024-05-16
大型语言模型不适合头脑风暴

这篇文章认为,大型语言模型(LLM)不适合用于真正的头脑风暴。作者指出,LLM主要训练目标是模仿人类产生的语料库中现有的模式,而不是被教导如何“头脑风暴”。因此,LLM倾向于趋同于现有数据中的共识,而不是提出真正具有创新性的想法。文章还提出了一些潜在的解决方案,例如创建包含优质头脑风暴示例的微调数据集,以及使用RLAIF等方法迭代地批判LLM在创造力方面的回应。

阅读更多
未分类 头脑风暴

FastHTML:用纯 Python 构建现代 Web 应用程序

2024-07-30
FastHTML:用纯 Python 构建现代 Web 应用程序

FastHTML 是一个用纯 Python 构建现代 Web 应用程序的库,它建立在坚实的 Web 基础之上,而不是最新的潮流之上。使用 FastHTML,您可以在几分钟内开始构建从简单的仪表板到可扩展的 Web 应用程序的任何内容。FastHTML 提供对 HTTP、HTML、JS 和 CSS 的完全访问,并将 Web 的基础带给您。FastHTML 应用程序快速且可扩展,并且易于部署,因为您可以使用任何支持 Python 的托管服务。

阅读更多
71
未分类 FastHTML

Spilo:基于 Docker 的高可用 PostgreSQL 集群

2024-06-12
Spilo:基于 Docker 的高可用 PostgreSQL 集群

Spilo是一个Docker镜像,它将PostgreSQL和Patroni捆绑在一起,用于创建高可用的PostgreSQL集群。多个Spilos可以通过相同的etcd地址和集群名称形成弹性集群。Spilo的创建者正在开发一个PostgreSQL operator,以便在Kubernetes环境中更轻松地部署和维护可扩展的PostgreSQL集群。

阅读更多
87
未分类 高可用性

谷歌拒绝对其搜索算法文档可能大规模泄露事件发表评论

2024-05-28
谷歌拒绝对其搜索算法文档可能大规模泄露事件发表评论

一份据称泄露的谷歌内部文件长达2500页,揭示了谷歌搜索算法的运作方式,引发了外界对谷歌多年来未公开其搜索算法真相的质疑。泄露的文件详细介绍了谷歌收集的数据类型、对敏感话题网站的评级方式、对小型网站的处理方式等,并暗示谷歌可能使用了其公开否认使用的Chrome数据进行排名。尽管谷歌尚未对文件的真实性作出回应,但该事件揭示了谷歌搜索算法的不透明性,并引发了对其公开声明可信度的质疑。

阅读更多
未分类 搜索算法

训练有素的 Transformer 是隐式推理器:通向泛化边缘的机械之旅

2024-05-27
训练有素的 Transformer 是隐式推理器:通向泛化边缘的机械之旅

本文研究了 Transformer 是否可以学习对参数知识进行隐式推理。研究发现 Transformer 可以通过“顿悟”,即长时间训练以克服过拟合,来学习隐式推理。然而,不同推理类型的泛化水平有所不同。分析表明,“顿悟”背后的机制与泛化电路的形成及其与记忆电路的相对效率有关。研究还发现,GPT-4-Turbo 和 Gemini-1.5-Pro 等基于非参数记忆的模型在复杂推理任务中表现不佳,而完全“顿悟”的 Transformer 可以实现近乎完美的准确性。

阅读更多
88
未分类 隐式推理 泛化

SAML的简要介绍

2024-07-22

这篇文章介绍了安全断言标记语言(SAML),它定义了用于交换安全相关消息的灵活规则集。文章解释了SAML的用途,包括单点登录(SSO),并简要介绍了Web浏览器SSO配置文件中涉及的实体,包括用户、服务提供商和身份提供商。文章还提供了一个SAML消息示例,并解释了SAML请求和响应在SSO流程中的作用。

阅读更多
未分类 SAML SSO

喜剧偶像鲍勃·纽哈特逝世,享年94岁

2024-07-18
喜剧偶像鲍勃·纽哈特逝世,享年94岁

美国喜剧演员鲍勃·纽哈特于7月18日在洛杉矶去世,享年94岁。纽哈特以其独特的观察性幽默风格著称,他的喜剧专辑和电视剧在20世纪70和80年代风靡一时。他曾三次获得艾美奖提名,并在2013年凭借《生活大爆炸》中的客串角色获得了艾美奖。纽哈特的作品对后来的喜剧演员产生了深远影响,他的去世是喜剧界的巨大损失。

阅读更多

HftBacktest: 基于 Rust 的高频交易回测和实时机器人

2024-06-21
HftBacktest: 基于 Rust 的高频交易回测和实时机器人

HftBacktest 是一个用 Rust 开发的框架,用于开发和运行高频交易和做市策略。它侧重于考虑馈送和订单延迟,以及订单队列位置以进行订单填充模拟。该框架旨在基于完整的订单簿和交易报价数据,提供更准确的基于市场回放的回测。您还可以使用相同的算法代码运行实时机器人。

阅读更多
85
未分类 高频交易 回测

arkenfox 图形界面

2024-07-14

这是一款名为 arkenfox gui 的图形界面工具,用于帮助用户理解和使用 arkenfox user.js 文件。arkenfox user.js 是一个 Firefox 配置文件模板,可以帮助用户更好地控制 Firefox 浏览器设置。

阅读更多
未分类

雅马哈 MDP-10:软盘 MIDI 录音机

2024-05-19
雅马哈 MDP-10:软盘 MIDI 录音机

本文介绍了雅马哈 MDP-10,这是一款以软盘播放 MIDI 文件的录音机,作者详细介绍了其功能,包括音轨控制、节奏调整、音调调整和移调功能。作者还讨论了 MDP-10 的预期市场,即想要演奏 MIDI 文件的声学乐器演奏者,并深入研究了其 MIDI 功能和局限性。文章还探讨了与其他 MIDI 设备和软件的兼容性,并展示了作者使用 MDP-10 与各种乐器进行实验。最后,作者深入介绍了 MDP-10 的内部硬件,包括微控制器、内存芯片和声音处理器。

阅读更多
未分类 雅马哈 软盘

DigiCert证书吊销事件

2024-07-30

DigiCert 将吊销未进行域名控制验证 (DCV) 的证书,约影响0.4%的有效域名验证。原因是 DigiCert 在某些基于 CNAME 的验证案例中没有在随机值前添加下划线前缀,这与 CABF 规则不符。受影响的客户已被通知,必须在 24 小时内更换证书。DigiCert 已采取预防措施,包括整合和审查所有随机值生成器、简化用户体验、将合规团队成员嵌入所有 CA 和 RA sprint 团队、增加测试覆盖范围以及开源 DCV 以供社区审查。

阅读更多

sqlite-vec v0.1.0 发布:一款可在任何地方运行的向量搜索 SQLite 扩展

2024-08-01
sqlite-vec v0.1.0 发布:一款可在任何地方运行的向量搜索 SQLite 扩展

sqlite-vec v0.1.0 是一个新的向量搜索 SQLite 扩展,完全用 C 编写,没有任何依赖项,采用 MIT/Apache-2.0 双许可证。它支持多种安装方式,并将在不久的将来成为 SQLite Cloud 和 Turso 等流行 SQLite 产品的一部分。sqlite-vec 的工作方式类似于 SQLite 的全文搜索支持,您可以声明一个带有向量列的“虚拟表”,使用普通的 INSERT INTO 语句插入数据,并使用普通的 SELECT 语句进行查询。目前它专注于快速蛮力向量搜索,并支持量化和 Matryoshka 嵌入等技术来提高效率。

阅读更多
未分类 sqlite-vec

柏拉图式表征假说

2024-05-15
柏拉图式表征假说

这篇论文论证了人工智能模型,特别是深度网络中的表征正在趋于一致。作者首先概述了文献中关于趋同的许多例子:随着时间的推移,跨越多个领域,不同神经网络表示数据的方式正变得越来越一致。接下来,作者论证了跨数据模态的趋同:随着视觉模型和语言模型变得越来越大,它们测量数据点之间距离的方式也越来越相似。作者假设这种趋同正在走向一种共享的现实统计模型,类似于柏拉图的理想现实概念。作者将这种表征称为柏拉图式表征,并讨论了导致这种表征的几种可能的压力。最后,作者讨论了这些趋势的影响、局限性以及分析的反例。

阅读更多
90

Rust 中的进程间通信:乒乓比较

2024-06-18

本文探讨并比较了 Rust 中几种进程间通信方法,包括管道、TCP、UDP 和共享内存,并通过“乒乓”测试评估其性能。结果表明,共享内存的速度最快,但实现复杂且存在安全风险;其他方法性能接近,但远低于共享内存。作者建议根据实际需求选择合适的通信方式,并提供了代码示例和测试结果分析。

阅读更多
未分类 进程间通信

matcha.css:一款纯 CSS 的语义化样式库

2024-05-23
matcha.css:一款纯 CSS 的语义化样式库

matcha.css 是一款纯 CSS 库,旨在为 HTML 元素提供类似于默认浏览器样式表的样式,无需用户手动修改文档。它适用于快速原型设计、静态 HTML 页面、Markdown 生成的文档以及希望简化工作流程而不必深入研究 CSS 复杂性的开发人员。该库无需构建步骤、依赖项、JavaScript、配置和重构,并且支持广泛的 HTML 元素。

阅读更多
未分类 样式库
1 2 10 11 12 14 16 17 18 1084 1085