EM-LLM:赋予大型语言模型无限上下文能力的类人记忆机制

2025-05-14
EM-LLM:赋予大型语言模型无限上下文能力的类人记忆机制

EM-LLM 是一种新型架构,它通过模仿人类情景记忆和事件认知,显著提升了大型语言模型处理超长文本的能力。该模型无需微调,就能将输入文本序列组织成连贯的情景事件,并通过高效的两阶段记忆检索机制访问相关信息。在 LongBench 和 ∞-Bench 基准测试中,EM-LLM 的性能超越了现有最先进的检索模型 InfLLM 和 RAG,甚至在大多数任务中优于全上下文模型,成功处理了 1000 万个 token 的检索任务,这对于全上下文模型来说是计算上不可行的。EM-LLM 的事件分割与人类感知事件高度相关,为探索人类记忆机制提供了新的计算框架。

阅读更多

Mycelium:一种新型数据存储和传输格式

2025-05-14
Mycelium:一种新型数据存储和传输格式

Mycelium 是一种基于类型的数据存储和传输格式,支持引用、表达式、函数、类型等。其虚拟机 MVM 以简洁高效著称,所有值都是不可变的,并通过端口进行进程间交互。MycZip 则负责将 Mycelium 值编码为单个文件,而 Mycelium 网络协议 (MNP) 基于 QUIC,用于在对等节点之间传输数据,并缓存已传输的值以提高效率。Spore 语言则为 MVM 提供了易于使用的编程接口。

阅读更多
开发

AG-UI:AI代理与前端应用交互的新协议

2025-05-13
AG-UI:AI代理与前端应用交互的新协议

AG-UI是一个轻量级、基于事件的开放协议,旨在标准化AI代理与前端应用的连接方式。它支持多种事件类型和传输方式,并提供灵活的中间件层,确保不同环境下的兼容性。AG-UI已与多个流行的代理框架集成,支持实时聊天、双向状态同步、生成式UI等功能,并提供React客户端库以及与AWS SNS合作开发的消息客户端。其简洁的设计和丰富的功能,使其成为构建AI驱动应用的理想选择。

阅读更多

HelixDB:一款超高速图向量数据库,为RAG和AI应用而生

2025-05-13
HelixDB:一款超高速图向量数据库,为RAG和AI应用而生

HelixDB是一个用Rust编写的开源图向量数据库,专为检索增强生成(RAG)和AI应用而设计。它基于LMDB存储引擎,速度极快,号称比Neo4j快1000倍,比TigerGraph快100倍,与Qdrant性能相当。HelixDB支持图和向量数据类型,提供ACID一致性,并具有易于使用的CLI工具和SDK(TypeScript和Python)。目前,团队正致力于扩展向量数据类型功能、增强查询语言以及构建测试套件等。长期目标包括开发内部图向量存储引擎和网络协议库。

阅读更多
开发

Windows LTSC 版本的微软应用商店安装包

2025-05-13
Windows LTSC 版本的微软应用商店安装包

这个项目提供了一个适用于 Windows 10 LTSC 2019、2021 和 Windows 11 LTSC 2024 的微软应用商店安装包。注意,最新版本的 LTSC 2019 已不再支持此应用商店,安装后可能需要更新系统才能正常使用。安装包下载后双击即可安装,但为了获得最佳体验,建议安装完成后在应用商店设置中更新到最新版本。

阅读更多

A5:全球毫米级精度地理空间索引

2025-05-13
A5:全球毫米级精度地理空间索引

A5 是一种将地球划分为五边形单元的地理空间索引,提供 32 个不同分辨率级别,最小单元面积小于 30mm²,且各级别单元面积近乎相等。它简化了空间数据的表示和分析,例如计算不同变量(例如海拔和作物产量)之间的相关性,或聚合点数据以理解其空间分布(例如,城市中的度假租赁密度)。A5 使用 TypeScript 实现,开源且基于 Apache 2.0 许可证。与其他 DGGS 系统相比,A5 具有单元大小一致、分辨率极高(30mm²)、全局单元面积畸变最小等优势,这源于其独特的基于正十二面体五边形平铺的设计,有效降低了投影过程中的几何畸变。

阅读更多

Firefox源码:贡献指南及构建说明

2025-05-13
Firefox源码:贡献指南及构建说明

想参与Firefox开发?Mozilla提供了详细的源码目录结构文档(https://firefox-source-docs.mozilla.org/contributing/directory_structure.html)和贡献快速参考(https://firefox-source-docs.mozilla.org/contributing/contribution_quickref.html),指导你如何构建Firefox并创建补丁。遇到问题?加入Matrix的`Introduction`频道(https://chat.mozilla.org/#/room/#introduction:mozilla.org)寻求帮助。你也可以下载每日构建版本进行测试(https://archive.mozilla.org/pub/firefox/nightly/latest-mozilla-central/ 或 https://www.mozilla.org/firefox/channel/desktop/#nightly),但需注意每日构建可能存在bug。

阅读更多
开发

FastVLM: 高效视觉编码,赋能视觉语言模型

2025-05-13
FastVLM: 高效视觉编码,赋能视觉语言模型

FastVLM是一种高效的视觉编码器,它能够显著减少高分辨率图像的编码时间和生成的token数量。即使是最小的FastVLM变体,其速度也比LLaVA-OneVision-0.5B快85倍,视觉编码器体积也小3.4倍。更大的FastVLM变体结合Qwen2-7B LLM,其性能优于Cambrian-1-8B等最新模型,并且TTFT快7.9倍。该项目还提供了一个iOS演示应用和详细的推理指南,方便开发者在移动设备和苹果设备上运行。

阅读更多

wtfis:强大的开源域名/IP信息收集工具

2025-05-12
wtfis:强大的开源域名/IP信息收集工具

wtfis是一个命令行工具,用于通过各种OSINT服务收集有关域名、FQDN或IP地址的信息。它设计简洁易用,以人类可读的方式呈现结果,并尽量减少API调用以避免超出配额。它整合了VirusTotal、IP2Whois、Shodan、Greynoise、URLhaus和AbuseIPDB等多个信息源,提供域名/IP地址的声誉评分、流行度排名、类别、解析结果、Whois信息、开放端口、恶意URL关联等丰富信息。用户可通过API密钥配置使用高级功能,并支持自定义参数和Docker部署。

阅读更多
安全 信息收集

Mergeable:GitHub PR 的更佳收件箱

2025-05-12
Mergeable:GitHub PR 的更佳收件箱

Mergeable 是一款提升 GitHub Pull Request 管理效率的浏览器应用。它允许用户通过灵活的搜索查询将 PR 组织成不同的区块,所有数据都存储在本地浏览器,支持快捷键快速导航,并能连接多个 GitHub 实例(包括 GitHub Enterprise)。更重要的是,它能突出显示需要你处理的 PR,无需安装任何 GitHub 应用。 你可以在 https://app.usemergeable.dev 使用公共实例,或参考 https://www.usemergeable.dev 的文档自行部署。

阅读更多
开发

Airweave:让你的AI代理轻松访问任何应用数据的工具

2025-05-12
Airweave:让你的AI代理轻松访问任何应用数据的工具

Airweave 是一款能让你的AI代理进行语义搜索任何应用程序的工具。它兼容MCP,并能无缝连接任何应用程序、数据库或API,将它们的内容转换为代理可用的知识。无论你的数据是结构化还是非结构化,Airweave都能帮你将其分解成可处理的实体,存储数据并通过REST和MCP端点进行检索。它支持多种数据源,并具有实体提取、转换管道、多租户架构、增量更新、语义搜索等功能。后端使用FastAPI (Python),数据库使用PostgreSQL和Qdrant,并支持Docker Compose和Kubernetes部署。

阅读更多
AI

StarGuard:GitHub 仓库信任评分工具

2025-05-12
StarGuard:GitHub 仓库信任评分工具

StarGuard 是一款命令行工具,用于检测 GitHub 仓库中的虚假点赞活动、依赖项劫持、许可证风险等开源风险信号。它通过分析仓库的点赞数、依赖项、许可证、维护者和代码等方面,生成一个信任评分,帮助 CTO、安全团队和风投公司快速评估开源项目的风险。StarGuard 支持多种输出格式,包括 JSON、Markdown 和纯文本报告,并可以生成星级历史图和 shields.io 徽章。

阅读更多
开发

kdlfmt: 一款强大的KDL代码格式化工具

2025-05-12
kdlfmt: 一款强大的KDL代码格式化工具

kdlfmt是一个基于Rust的命令行工具,用于格式化KDL (KDL)文档。它支持多种安装方式,包括Cargo、Homebrew、npm和预编译二进制文件。kdlfmt 提供了 `format` 命令用于格式化KDL文件,`check` 命令用于验证文件格式,以及 `completions` 命令用于生成shell自动补全功能。它还支持`.kdlfmtignore`文件来忽略特定文件或目录,并提供了多种配置选项,例如指定KDL版本和日志级别。无论是通过管道输入还是直接处理文件,kdlfmt都能高效地格式化你的KDL代码,提高代码的可读性和一致性。

阅读更多
开发 KDL

Rust编写的分布式SQL数据库toyDB:一个教育项目

2025-05-11
Rust编写的分布式SQL数据库toyDB:一个教育项目

toyDB是一个用Rust从零开始构建的分布式SQL数据库教育项目。它旨在以简单易懂的方式演示分布式SQL数据库的架构和概念,支持大多数常见的SQL特性,包括连接、聚合和事务。虽然性能和可扩展性并非其主要目标,但它包含一个基准测试工具,用于评估不同工作负载下的性能。toyDB采用Raft共识算法管理事务性键值存储,并在此之上构建SQL查询引擎。

阅读更多
开发

Scraperr:基于XPath的精准网页数据抓取工具

2025-05-11
Scraperr:基于XPath的精准网页数据抓取工具

Scraperr是一款自托管的网页数据抓取应用,使用XPath选择器精准提取网站数据。它提供简洁的界面来管理抓取任务、查看结果和导出数据。支持队列管理、域名爬取、自定义请求头、媒体文件下载、结果可视化和多种数据导出格式,并提供通知功能。请务必遵守robots.txt、网站服务条款和限速规则,仅用于允许抓取的网站。

阅读更多
开发 网页爬虫

GlassFlow:Kafka 到 ClickHouse 的实时流式 ETL

2025-05-11
GlassFlow:Kafka 到 ClickHouse 的实时流式 ETL

GlassFlow 是一款针对数据工程师设计的实时流处理器,它简化了 Kafka 和 ClickHouse 之间数据管道的创建和管理。它提供了一个用户友好的界面,用于构建和管理实时数据管道,并内置了去重和时间连接等功能。GlassFlow 支持延迟事件处理,确保数据处理的准确性和一致性,并具有高吞吐量和低延迟的特点。通过直观的 Web 界面,可以轻松配置和监控管道,其强大的架构确保了可靠的数据处理。它支持本地开发和 Docker 部署,并提供了一个全面的演示环境,方便用户快速上手。

阅读更多
开发 实时处理

基于电路板应变传感器的微小形变测量

2025-05-11
基于电路板应变传感器的微小形变测量

这个项目展示了一种巧妙的应变传感器设计,其传感元件直接集成在电路板上。该传感器灵敏度极高,能够测量微米级的挠度,量程可达±3厘米。它采用4元件或2元件桥式电路,可通过手工组装完成,无需回流焊。用户可以选择使用集成的Seeed Studio XIAO RP2040微控制器或外部微控制器。此外,还提供了一个Python脚本用于数据可视化和一个Jupyter Notebook用于自定义传感元件形状。

阅读更多

LoopMix128: 超高速且稳健的 2^128 周期 PRNG

2025-05-10
LoopMix128: 超高速且稳健的 2^128 周期 PRNG

LoopMix128 是一种超高速伪随机数生成器 (PRNG),具有 2^128 的保证周期、已证明的单射性,并在 BigCrush 和 PractRand (32TB) 测试中表现出色。它专为速度和统计质量至关重要的非加密应用而设计。LoopMix128 比标准库生成器快得多,并且与其他现代高速 PRNG(如 wyrand 和 xoroshiro128++)相比速度更快或相当。它通过了 TestU01 的 BigCrush 测试套件和 PractRand (高达 32TB) 测试,且没有异常。其 128 位低/高计数器循环确保了最小的 2^128 周期长度。Z3 证明器证明了其 192 位状态的单射性。

阅读更多
开发

用树莓派监控食肉植物?这开发者有点酷!

2025-05-10
用树莓派监控食肉植物?这开发者有点酷!

一位开发者利用树莓派5、7寸触摸屏等硬件,结合3D打印外壳,打造了一个名为Xenolab的食肉植物监控系统。该系统可监控温度、湿度、土壤湿度,并模拟风和光照。开发者表示,这个项目虽然有些过度工程化,但主要是为了好玩,并分享了其3D建模和电路连接过程,以及最终运行的成果。

阅读更多
硬件 食肉植物

Python SDK简化Claude CLI交互

2025-05-10
Python SDK简化Claude CLI交互

一个新的Python SDK,`codesys`,让开发者可以更轻松地与Claude CLI工具交互。它支持所有Claude CLI选项,并提供自动或手动流输出功能,以及自定义工具访问。开发者可以通过模仿其Claude代码工作流程来高效利用SDK,首先规划任务,然后实施计划。该SDK还提供多种示例,展示如何进行自动和手动流输出、JSON解析、自定义工具以及传递额外参数等操作。

阅读更多
开发

QueryLeaf:将SQL查询轻松转换为MongoDB命令

2025-05-10
QueryLeaf:将SQL查询轻松转换为MongoDB命令

QueryLeaf是一个Node.js库,它能将SQL查询语句转换成MongoDB命令。它使用node-sql-parser解析SQL,将其转换为抽象命令集,然后使用MongoDB Node.js驱动程序执行这些命令。QueryLeaf支持基本的SQL操作(SELECT、INSERT、UPDATE、DELETE)以及高级查询功能,例如嵌套字段访问、数组元素访问、GROUP BY聚合函数和JOIN操作。它提供多种接口,包括库、CLI和Web服务器。测试和调试可以使用DummyQueryLeaf,无需实际数据库连接。

阅读更多
开发 SQL到MongoDB

Gmail邮件到SQLite数据库:终极邮箱分析利器

2025-05-10
Gmail邮件到SQLite数据库:终极邮箱分析利器

这个脚本可以将Gmail邮件下载到SQLite数据库,方便进行数据分析。你可以查询每个发件人收到的邮件数量、邮件大小以及未读邮件等信息。设置过程需要创建Google Cloud项目,启用Gmail API,并创建OAuth客户端ID。脚本运行后,可以使用sqlite3命令行工具查询数据库。支持增量同步和完整同步,方便管理邮件数据。

阅读更多
开发

Erlang构建的OpenAI API分布式框架

2025-05-09
Erlang构建的OpenAI API分布式框架

一个使用Erlang构建的强大分布式框架,用于与OpenAI API集成。它具有内置的监督树、动态API客户端生成和工具执行功能,支持所有OpenAI API端点,并具有容错、速率限制和流支持等特性。该框架采用分层监督树结构,确保了系统的稳定性和可靠性,开发者可以轻松注册和执行自定义工具,并通过简单的函数调用直接访问OpenAI API。

阅读更多

BlenderQ:命令行Blender渲染队列管理器

2025-05-09
BlenderQ:命令行Blender渲染队列管理器

BlenderQ是一个命令行界面工具,用于管理本地Blender渲染队列。你可以添加多个.blend文件到队列中,并在终端监控它们的渲染进度。它使用Node.js和Ink构建,支持主题和Nerd Fonts图标,安装方便快捷。作者选择Node.js而非Python或Go,是因为其现有的组件更符合需求,能够快速交付功能完善且易于维护的终端UI。

阅读更多
开发

Cogent Core:一套编写一次,随处运行的跨平台框架

2025-05-09
Cogent Core:一套编写一次,随处运行的跨平台框架

Cogent Core是一个免费开源的框架,用于构建运行在macOS、Windows、Linux、iOS、Android和Web上的强大、快速、优雅的2D和3D应用程序。它使用Go语言编写,实现了“编写一次,随处运行”的目标。官方网站提供详尽的文档和可直接编辑运行的交互式示例,网站本身就是一个使用wasm在Web上运行的Cogent Core应用程序。在系统上使用Cogent Core进行开发之前,必须完成网站上的安装说明。

阅读更多
开发

fui:一个基于帧缓冲区的TTY界面库

2025-05-08
fui:一个基于帧缓冲区的TTY界面库

fui是一个用C语言编写的轻量级帧缓冲区用户界面库,可在TTY环境下直接操作帧缓冲区。它采用分层绘图系统,支持像素绘制、基本图形绘制(线条、矩形、圆形)、位图字体渲染、键盘鼠标事件处理(使用libevdev)以及简单的基于alsa的声效系统(目前支持正弦波和和弦)。该库静态链接,包含示例和测试用例(使用cmocka)。其中,asteroids文件夹包含一个简单的同名游戏示例,展示了库的声效功能。

阅读更多
开发

神器!req-update-check:一键更新你的requirements.txt

2025-05-08
神器!req-update-check:一键更新你的requirements.txt

还在手动更新 `requirements.txt` 文件吗?试试 `req-update-check`!这款 Python 工具可以自动检查你的依赖包是否有更新,并显示更新的严重程度(major/minor/patch),甚至还能显示包的首页和变更日志。支持缓存、注释和多种安装方式,极大地简化了依赖管理流程。快来提升你的开发效率吧!

阅读更多
开发

开源代码编辑器Void:Cursor的强力替代品

2025-05-08
开源代码编辑器Void:Cursor的强力替代品

Void是一个开源的代码编辑器,旨在成为Cursor的替代品。该项目已公开全部源代码,并欢迎所有贡献者。开发者提供详细的贡献指南(HOW_TO_CONTRIBUTE)以及代码库指南(VOID_CODEBASE_GUIDE),并通过Discord服务器和邮件地址([email protected])保持与社区的联系。Void基于VS Code代码库进行开发,鼓励协作和各种建议。

阅读更多

Qtap:无需修改应用即可捕获Linux内核网络流量的eBPF代理

2025-05-08
Qtap:无需修改应用即可捕获Linux内核网络流量的eBPF代理

Qtap是一款基于eBPF的代理,能够捕获Linux内核中流动的网络流量,无需修改应用程序、安装代理或管理证书。它通过附加到TLS/SSL函数来拦截加密前后数据,并将其传递给灵活的插件,提供全面的上下文信息(进程/容器/主机/用户/协议等)。Qtap能够以极低的开销和无延迟的方式显示原始未加密的数据,增强现有可观测性管道,并可用于安全审计、网络问题调试、API开发、第三方集成故障排除等多种场景。目前Qtap处于早期开发阶段,部分API可能会有所变化,文档可能不完整,但欢迎社区贡献和反馈。

阅读更多
开发
← 前页 1 3 4 5 6 7 8 9 72 73