Yi-1.5:性能更强的升级版Yi模型
Yi-1.5是Yi的升级版本,经过5000亿token的高质量语料库持续预训练,并在300万个不同的微调样本上进行了微调。与Yi相比,Yi-1.5在编码、数学、推理和指令跟随能力方面表现更出色,同时仍然保持了在语言理解、常识推理和阅读理解方面的出色能力。Yi-1.5提供三种模型尺寸:34B、9B和6B。
阅读更多
Yi-1.5是Yi的升级版本,经过5000亿token的高质量语料库持续预训练,并在300万个不同的微调样本上进行了微调。与Yi相比,Yi-1.5在编码、数学、推理和指令跟随能力方面表现更出色,同时仍然保持了在语言理解、常识推理和阅读理解方面的出色能力。Yi-1.5提供三种模型尺寸:34B、9B和6B。
阅读更多
乐高与欧洲航天局合作,用真正的陨石尘埃制作了乐高积木,并在指定商店展出至9月20日。此举旨在测试月球尘埃作为月球建筑材料的可行性,探索利用月球现有材料建造太空设施的可能性。
阅读更多
Kalmia 是一款免费开源的文档搜索工具,致力于高效便捷地获取知识。它采用 Go 语言编写,并使用基于 Rust 的 RsPress 进行 Markdown 处理,因此执行和构建速度都非常快。Kalmia 易于使用,无论新手还是专家都能轻松上手。
阅读更多
PgQueuer 是一个 Python 库,它利用 PostgreSQL 的强大功能来实现高效的作业队列。PgQueuer 旨在简化和提高效率,它使用 PostgreSQL 的 LISTEN/NOTIFY 来轻松管理作业队列。文章提供了一个使用示例,演示了如何编写消费者和生产者来处理入队作业。
阅读更多
本文介绍了九型人格理论,作者从自身经历出发,讲述了如何通过九型人格理论更好地理解自己和他人。文章将九型人格比喻成一个房间的九个角落,每个人都倾向于待在自己舒适的角落,而九型人格理论鼓励人们走出舒适区,探索更广阔的自我。
阅读更多
本文介绍了两种常用的图像抖动算法:Floyd-Steinberg 抖动和 Atkinson 抖动。Floyd-Steinberg 抖动算法采用误差扩散的方式,将当前像素的量化误差扩散到周围未处理的像素,从而模拟出灰度效果。Atkinson 抖动算法是 Floyd-Steinberg 算法的一种变体,它采用更广泛的误差扩散模式,并保留了四分之三的误差,能够产生更丰富的对比度。文章还介绍了如何在 iKe 软件中实现 Atkinson 抖动算法。
阅读更多
Sonarr 是一款面向新闻组和 BT 用户的 PVR,它可以监控多个 RSS 源,查找您喜爱的节目的新剧集,并抓取、分类和重命名它们。它还可以配置为在有更好质量的格式可用时自动升级已下载文件的质量。
阅读更多
微软创始人比尔·盖茨认为,相较于人工智能的巨大潜力,人们不应过度担忧其能源消耗问题。他认为人工智能将在提高生产力和解决气候变化等全球性挑战方面发挥关键作用,并表示对人工智能的未来持乐观态度。
阅读更多
avante.nvim 是一个 Neovim 插件,旨在模拟 Cursor AI IDE 的行为。它为用户提供 AI 驱动的代码建议,并能够以最小的努力将这些建议直接应用于他们的源文件。该插件目前只兼容 Neovim 0.10.0 或更高版本,并且主要支持 OpenAI 和 Claude。
阅读更多
这篇文章认为,大型语言模型(LLM)不适合用于真正的头脑风暴。作者指出,LLM主要训练目标是模仿人类产生的语料库中现有的模式,而不是被教导如何“头脑风暴”。因此,LLM倾向于趋同于现有数据中的共识,而不是提出真正具有创新性的想法。文章还提出了一些潜在的解决方案,例如创建包含优质头脑风暴示例的微调数据集,以及使用RLAIF等方法迭代地批判LLM在创造力方面的回应。
阅读更多
FastHTML 是一个用纯 Python 构建现代 Web 应用程序的库,它建立在坚实的 Web 基础之上,而不是最新的潮流之上。使用 FastHTML,您可以在几分钟内开始构建从简单的仪表板到可扩展的 Web 应用程序的任何内容。FastHTML 提供对 HTTP、HTML、JS 和 CSS 的完全访问,并将 Web 的基础带给您。FastHTML 应用程序快速且可扩展,并且易于部署,因为您可以使用任何支持 Python 的托管服务。
阅读更多
AMD斥资6.65亿美元收购了芬兰人工智能初创公司Silo AI,以加强其人工智能领域的实力,试图与英伟达展开竞争。
阅读更多
Spilo是一个Docker镜像,它将PostgreSQL和Patroni捆绑在一起,用于创建高可用的PostgreSQL集群。多个Spilos可以通过相同的etcd地址和集群名称形成弹性集群。Spilo的创建者正在开发一个PostgreSQL operator,以便在Kubernetes环境中更轻松地部署和维护可扩展的PostgreSQL集群。
阅读更多
一份据称泄露的谷歌内部文件长达2500页,揭示了谷歌搜索算法的运作方式,引发了外界对谷歌多年来未公开其搜索算法真相的质疑。泄露的文件详细介绍了谷歌收集的数据类型、对敏感话题网站的评级方式、对小型网站的处理方式等,并暗示谷歌可能使用了其公开否认使用的Chrome数据进行排名。尽管谷歌尚未对文件的真实性作出回应,但该事件揭示了谷歌搜索算法的不透明性,并引发了对其公开声明可信度的质疑。
阅读更多
本文研究了 Transformer 是否可以学习对参数知识进行隐式推理。研究发现 Transformer 可以通过“顿悟”,即长时间训练以克服过拟合,来学习隐式推理。然而,不同推理类型的泛化水平有所不同。分析表明,“顿悟”背后的机制与泛化电路的形成及其与记忆电路的相对效率有关。研究还发现,GPT-4-Turbo 和 Gemini-1.5-Pro 等基于非参数记忆的模型在复杂推理任务中表现不佳,而完全“顿悟”的 Transformer 可以实现近乎完美的准确性。
阅读更多
美国喜剧演员鲍勃·纽哈特于7月18日在洛杉矶去世,享年94岁。纽哈特以其独特的观察性幽默风格著称,他的喜剧专辑和电视剧在20世纪70和80年代风靡一时。他曾三次获得艾美奖提名,并在2013年凭借《生活大爆炸》中的客串角色获得了艾美奖。纽哈特的作品对后来的喜剧演员产生了深远影响,他的去世是喜剧界的巨大损失。
阅读更多
HftBacktest 是一个用 Rust 开发的框架,用于开发和运行高频交易和做市策略。它侧重于考虑馈送和订单延迟,以及订单队列位置以进行订单填充模拟。该框架旨在基于完整的订单簿和交易报价数据,提供更准确的基于市场回放的回测。您还可以使用相同的算法代码运行实时机器人。
阅读更多
这是一款名为 arkenfox gui 的图形界面工具,用于帮助用户理解和使用 arkenfox user.js 文件。arkenfox user.js 是一个 Firefox 配置文件模板,可以帮助用户更好地控制 Firefox 浏览器设置。
阅读更多
本文介绍了CURLoRA,这是一种利用CUR矩阵分解在低秩适应(LoRA)环境中微调大型语言模型(LLM)的新方法。该方法解决了LLM微调中的两个关键挑战:在持续学习期间减轻灾难性遗忘和减少可训练参数的数量。
阅读更多
Kompute 是一款建立在 Vulkan API 之上的开源 GPU 计算框架,支持 AMD、高通、英伟达等厂商的显卡。它速度快,支持移动设备,异步并针对高级 GPU 数据处理用例进行了优化。Kompute 提供 C++ 和 Python 接口,并具有异步和并行处理能力。
阅读更多
本文介绍了雅马哈 MDP-10,这是一款以软盘播放 MIDI 文件的录音机,作者详细介绍了其功能,包括音轨控制、节奏调整、音调调整和移调功能。作者还讨论了 MDP-10 的预期市场,即想要演奏 MIDI 文件的声学乐器演奏者,并深入研究了其 MIDI 功能和局限性。文章还探讨了与其他 MIDI 设备和软件的兼容性,并展示了作者使用 MDP-10 与各种乐器进行实验。最后,作者深入介绍了 MDP-10 的内部硬件,包括微控制器、内存芯片和声音处理器。
阅读更多
DigiCert 将吊销未进行域名控制验证 (DCV) 的证书,约影响0.4%的有效域名验证。原因是 DigiCert 在某些基于 CNAME 的验证案例中没有在随机值前添加下划线前缀,这与 CABF 规则不符。受影响的客户已被通知,必须在 24 小时内更换证书。DigiCert 已采取预防措施,包括整合和审查所有随机值生成器、简化用户体验、将合规团队成员嵌入所有 CA 和 RA sprint 团队、增加测试覆盖范围以及开源 DCV 以供社区审查。
阅读更多
sqlite-vec v0.1.0 是一个新的向量搜索 SQLite 扩展,完全用 C 编写,没有任何依赖项,采用 MIT/Apache-2.0 双许可证。它支持多种安装方式,并将在不久的将来成为 SQLite Cloud 和 Turso 等流行 SQLite 产品的一部分。sqlite-vec 的工作方式类似于 SQLite 的全文搜索支持,您可以声明一个带有向量列的“虚拟表”,使用普通的 INSERT INTO 语句插入数据,并使用普通的 SELECT 语句进行查询。目前它专注于快速蛮力向量搜索,并支持量化和 Matryoshka 嵌入等技术来提高效率。
阅读更多
本文探讨并比较了 Rust 中几种进程间通信方法,包括管道、TCP、UDP 和共享内存,并通过“乒乓”测试评估其性能。结果表明,共享内存的速度最快,但实现复杂且存在安全风险;其他方法性能接近,但远低于共享内存。作者建议根据实际需求选择合适的通信方式,并提供了代码示例和测试结果分析。
阅读更多
matcha.css 是一款纯 CSS 库,旨在为 HTML 元素提供类似于默认浏览器样式表的样式,无需用户手动修改文档。它适用于快速原型设计、静态 HTML 页面、Markdown 生成的文档以及希望简化工作流程而不必深入研究 CSS 复杂性的开发人员。该库无需构建步骤、依赖项、JavaScript、配置和重构,并且支持广泛的 HTML 元素。
阅读更多