开源大模型OCR和数据提取基准测试工具

2025-04-01
开源大模型OCR和数据提取基准测试工具

一个名为Omni的开源基准测试工具横空出世,它对GPT-4o等多种大型多模态模型的OCR和数据提取能力进行了全面对比,评估了文本和JSON提取的准确性。该工具使用开源评估数据集和方法,并鼓励扩展到更多提供商。测试涵盖了从文档到OCR再到提取的全过程,并采用修改后的json-diff计算JSON提取精度,同时使用Levenshtein距离衡量文本相似度。支持多种模型,包括OpenAI、Google Gemini、Anthropic等,用户可通过简单的命令行操作运行测试,结果将保存为JSON文件。

阅读更多
开发

Zig 依赖图拓扑排序库 TopoSort:高效并行处理

2025-04-01
Zig 依赖图拓扑排序库 TopoSort:高效并行处理

TopoSort 是一个高效的 Zig 库,用于对依赖图进行拓扑排序。它支持构建依赖图、进行拓扑排序、生成用于并行处理的无依赖子集、循环检测和报告,并支持不同类型的节点。该库提供命令行界面工具 `toposort-cli`,方便用户使用。通过设置 `max_range` 参数,可以优化性能,构建依赖树的速度提升 3-4 倍。TopoSort 使用 MIT 许可证。

阅读更多
开发 拓扑排序

RubyUI:超速Rails UI组件库

2025-04-01
RubyUI:超速Rails UI组件库

RubyUI (前身PhlexUI)是一个基于Phlex的Rails UI组件库,其速度比传统ERB模板快12倍。它提供了一系列可复用、可定制的组件,你可以直接复制粘贴到你的应用中。RubyUI注重简洁的设计、易于组织的组件以及强大的可定制性,并提供了丰富的文档和示例。它使用自定义的Stimulus.js控制器,依赖性极低,能够轻松构建高效、美观的Rails应用界面。

阅读更多
开发 UI组件库

AI 手机控制:用代码操控你的安卓手机

2025-04-01
AI 手机控制:用代码操控你的安卓手机

一个名为`mobile-use`的开源项目利用AI技术实现安卓手机的代码控制。只需编写指令,例如“打开Instagram并发送消息”,该项目即可通过本地安装的Android SDK工具(adb)执行。它支持自定义LLM模型,并提供命令行工具和文件输入两种使用方法,方便用户通过命令行或文件直接输入指令。该项目采用MIT开源许可证。

阅读更多
开发

149 字节的极简 PubSub 库

2025-04-01
149 字节的极简 PubSub 库

本文介绍了一个仅 149 字节的极简 PubSub 库,几乎没有依赖。作者将其与其他同类库 nano-pubsub (194 字节) 和 tiny-pubsub (401 字节) 进行比较,展现了其极小的体积优势。该库基于 EventTarget 实现,代码简洁易懂,并提供 TypeScript 类型定义。文章还鼓励读者提出改进建议,以进一步缩小代码体积。

阅读更多
开发 PubSub

KOReader:一款强大的跨平台电子书阅读器

2025-04-01
KOReader:一款强大的跨平台电子书阅读器

KOReader是一款面向电子墨水屏阅读器的文档阅读器,支持多种格式(PDF、EPUB、MOBI等)和多种设备(Kindle,Kobo等)。它具有高度可定制的阅读视图、多语言支持、与Calibre等工具集成等功能,并针对电子墨水屏进行了优化,具有快速翻页等优点。此外,它还支持插件扩展,并由全球志愿者开发和维护。

阅读更多
开发

Apache Airflow AI SDK:用LLM赋能你的数据管道

2025-03-31
Apache Airflow AI SDK:用LLM赋能你的数据管道

这个Apache Airflow AI SDK基于Pydantic AI,允许用户在Airflow管道中直接调用大型语言模型(LLM)并编排代理调用。它使用基于装饰器的任务(@task.llm,@task.llm_branch,@task.agent)简化了LLM集成,支持OpenAI、Anthropic等多种模型,并提供自动输出解析和DAG控制流分支功能,让你的数据工作流更智能高效。

阅读更多
开发

开源的统一模型上下文协议服务器集合:guMCP

2025-03-31
开源的统一模型上下文协议服务器集合:guMCP

Gumloop发布了guMCP,一个开源的模型上下文协议(MCP)服务器集合,支持本地和远程运行。它旨在构建最大的MCP服务器集合,拥有统一的后端,并促进AI集成和AGI未来的社区发展。guMCP支持stdio和SSE传输,包含文件系统、数据库、开发工具、Web自动化等多种服务器,并鼓励社区贡献。项目遵循GPL-3.0许可证,并高度重视安全,符合SOC 2 Type II、GDPR和HIPAA标准。

阅读更多
开发

WhatsApp MCP 服务器:用 Claude 控制你的 WhatsApp

2025-03-31
WhatsApp MCP 服务器:用 Claude 控制你的 WhatsApp

这是一个将 WhatsApp 与 Claude 大型语言模型 (LLM) 集成的项目。它使用 Go 编写的桥接程序连接到 WhatsApp Web 多设备 API,并将消息存储在本地 SQLite 数据库中。Python 服务器实现模型上下文协议 (MCP),允许 Claude 通过一系列工具搜索消息、联系人,并发送消息。所有数据处理都在本地进行,保护用户隐私。

阅读更多
开发

超速安装 Windows 9x: 90秒搞定!

2025-03-31
超速安装 Windows 9x: 90秒搞定!

厌倦了漫长的 Windows 98 安装过程?Windows 9x QuickInstall 应运而生!这个项目利用 Linux 和自定义安装程序,将已安装的 Windows 98 系统打包成 ISO 镜像,实现约 60-90 秒的超快安装速度。它支持 Windows 98、Windows 98 SE 和 Windows ME,并允许灵活添加驱动程序和工具。虽然构建 ISO 镜像的过程比 nLite 更复杂,但可定制性也大大增强,适合追求极致速度和个性化安装体验的用户。

阅读更多
开发 快速安装

Ambermoon Advanced:大型RPG扩展的逐章节发布

2025-03-31
Ambermoon Advanced:大型RPG扩展的逐章节发布

独立开发者Pyrdacor正在分章节发布其大型RPG游戏Ambermoon的非官方扩展Ambermoon Advanced。该扩展计划分五个章节发布,目前已发布前三个章节,包含“海洋的奥秘”和“元素生物”等内容。游戏可在Amiga和现代系统上运行,但Amiga版本尚未完善。开发者强调游戏仍在开发中,可能存在bug和不平衡之处。他还计划出版一本实体手册,包含游戏信息和Ambermoon的相关知识。

阅读更多
游戏 游戏扩展

怀旧复古桌面系统Blue95:重温90年代经典

2025-03-30
怀旧复古桌面系统Blue95:重温90年代经典

Blue95是一个轻量级桌面系统,它以Fedora Atomic Xfce为基础,搭配Chicago95主题,带你重温90年代的经典电脑体验。虽然自带安装程序尚处于alpha版本,官方推荐通过其他方法安装,例如从其他Fedora Atomic桌面(如winblues/vauxite)重新设置基础。Blue95致力于提供易用性强的复古体验,而非对老旧操作系统的精确复刻。它还整合了Universal Blue的改进,例如编解码器和自动更新等功能,力求开箱即用。目前Blue95还推出了测试版Live ISO,无需安装即可体验。

阅读更多
开发 复古桌面

Kalua:轻松构建网状网络

2025-03-30
Kalua:轻松构建网状网络

Kalua是一个简化网状网络构建的工具。它提供了一套脚本,可以轻松地在OpenWrt路由器上构建和配置网状网络,支持多种硬件和用例。只需几条简单的命令,即可下载、构建并安装Kalua,实现轻松便捷的网状网络部署。

阅读更多

PG-MCP:增强型PostgreSQL模型上下文协议服务器

2025-03-30
PG-MCP:增强型PostgreSQL模型上下文协议服务器

PG-MCP是一个为PostgreSQL数据库设计的模型上下文协议(MCP)服务器,它为AI代理提供了增强的功能。它构建在PostgreSQL MCP参考实现之上,增加了对多数据库支持、丰富的元数据信息(包括PostGIS和pgvector扩展)、查询计划分析工具以及强大的连接管理等功能。开发者可以使用Docker或虚拟环境部署PG-MCP,并通过提供的Python客户端与之交互,甚至可以结合Claude等大型语言模型实现自然语言到SQL的转换。

阅读更多
开发

msgpack23: 一个现代化的C++ MessagePack库

2025-03-30
msgpack23: 一个现代化的C++ MessagePack库

msgpack23是一个轻量级的C++库,用于MessagePack格式数据的序列化和反序列化。它采用现代C++(C++20及以上)编写,利用模板和类型特性,提供了一种灵活、零依赖的解决方案,支持多种数据类型。该库是头文件式的,易于使用,支持STL容器、时间点对象、自定义类型等,并具有良好的性能和可扩展性。

阅读更多
开发

xan:命令行CSV神器,速度与效率的极致追求

2025-03-29
xan:命令行CSV神器,速度与效率的极致追求

xan是一个命令行工具,用于快速处理大型CSV文件。它使用Rust编写,支持多线程并行处理,能够轻松应对数GB的CSV文件。xan不仅可以预览、过滤、切片、聚合、排序和连接CSV文件,还拥有强大的表达式语言,可以执行复杂的自定义数据处理任务,速度超越Python等动态类型语言。它源于xsv项目,但经过重新编写,以满足社会科学数据分析的需求,并扩展了词频统计、图论和网络爬取等功能。xan支持多种安装方式,包括cargo、Homebrew、pacman和Nix,并提供预编译二进制文件。

阅读更多
开发 CSV处理

JobHuntr: LinkedIn 自动求职神器,告别简历投递疲劳

2025-03-29
JobHuntr: LinkedIn 自动求职神器,告别简历投递疲劳

JobHuntr 是一款 macOS 桌面应用,利用 Ollama 驱动的 AI 自动化申请 LinkedIn 上的工作,全天候 24/7 运行,无需 OpenAI API 密钥。它支持“轻松申请”选项的职位(约 70%),每天最多可申请 25 个职位。AI 会根据你的简历和 FAQ 填写问题,并谨慎检查信息准确性。如有不确定问题,会保存到 FAQ 并跳过该申请。该应用模仿人类行为,并使用你的 IP 地址发送请求,降低 LinkedIn 检测到自动化的风险。

阅读更多
开发

LVGL:轻量级嵌入式图形库,打造惊艳UI

2025-03-29
LVGL:轻量级嵌入式图形库,打造惊艳UI

LVGL是一款流行的开源嵌入式图形库,它轻量、灵活,能为各种MCU、MPU和显示器创建漂亮的UI。它拥有30多种内置小部件、强大的样式系统和Web风格的布局管理器,支持多种语言和丰富的功能,只需极少的资源即可运行。LVGL团队还提供图形设计、UI实现和咨询服务,帮助开发者轻松创建高质量的GUI。

阅读更多

RTABench:一款针对实时分析应用的全新基准测试工具

2025-03-29
RTABench:一款针对实时分析应用的全新基准测试工具

传统的分析基准测试往往忽略了实时应用的需求,例如针对特定用户、设备或交易的快速、目标明确的洞察。RTABench应运而生,它采用规范化的模式、真实的数据集大小和与现实世界使用模式相符的查询,更准确地反映了应用内实时分析的特性。该基准测试包含33个查询,涵盖了原始事件查询、选择性过滤、多表连接和预聚合查询,从而评估数据库在处理规范化模式、选择性过滤和增量物化视图方面的性能。RTABench支持多个数据库,并欢迎社区贡献,以扩展其支持的数据库和优化。

阅读更多

将显卡VRAM化身RAM盘:vramfs项目详解

2025-03-29
将显卡VRAM化身RAM盘:vramfs项目详解

vramfs是一个利用FUSE库将显卡VRAM转换为文件系统的实用程序。它类似于RAM盘,但使用的是独立显卡的显存。虽然不适合高强度使用,但在拥有4GB或更大显存的消费级GPU上表现良好。开发者的测试中,连续读取速度约为2.4 GB/s,写入速度约为2.0 GB/s,约为RAM盘的1/3。该项目使用OpenCL进行内存管理,并通过FUSE库简化了开发过程。未来改进方向包括提升性能,以接近PCI-e带宽限制。

阅读更多
开发 VRAM

用TypeScript学习日语语法:Typed Japanese项目详解

2025-03-29
用TypeScript学习日语语法:Typed Japanese项目详解

Typed Japanese是一个利用TypeScript类型系统表达完整日语句子的库。它基于日语语法规则创建了一个领域特定语言(DSL),允许使用TypeScript编译器编写和验证一部分语法正确的自然语言。该项目还探索了AI在语言学习中的中间格式,例如,大型语言模型可以使用此格式返回日语句子的语法分析,而不是JSON,从而通过TypeScript的类型检查器进行验证,提高正确性。该系统支持动词、形容词的各种活用形式,并支持短语和句子的构建,最终目标是创建一个用于学习和验证日语语法的类型系统。

阅读更多
开发

告别回合制!实时物理象棋桌横空出世

2025-03-29
告别回合制!实时物理象棋桌横空出世

厌倦了象棋回合制带来的漫长等待?一位开发者设计了一款实时物理象棋桌,彻底摒弃了回合制概念。每颗棋子都有独立冷却时间,并由电路板和电磁铁物理限制移动,有效防止作弊。该项目开源了电路板设计和固件,但作者也指出了设计中的不足,例如供电不足和公差过紧等问题。

阅读更多
硬件

bknd:轻量级全功能后端,简化应用开发

2025-03-29
bknd:轻量级全功能后端,简化应用开发

bknd是一个轻量级的后端解决方案,它提供数据库管理、身份验证、媒体处理和工作流等全套功能,基于Web标准构建,几乎可在任何地方部署,包括你选择的框架内部。它简化了应用开发流程,无需再部署多个独立服务。bknd 提供了REST API、React SDK、以及用于身份验证和媒体组件的React元素,并具有易于使用的管理员UI。目前仍处于积极开发中,尚未达到1.0.0版本,因此不保证完全向后兼容。

阅读更多
开发

基于ESP32的番茄工作法计时器:硬件DIY与软件开发

2025-03-29
基于ESP32的番茄工作法计时器:硬件DIY与软件开发

一位软件工程师出于对生产力提升的追求,并为了回馈朋友,设计了一款基于ESP32的番茄工作法计时器。该计时器使用电子墨水屏和旋转编码器,具有物理设备、趣味性和易用性等特点。项目涉及硬件选择(ESP32、电子墨水屏、旋转编码器、LED等)、软件开发(C++、Arduino框架、GxEPD2库)以及3D打印外壳设计等方面。作者分享了设计过程中的经验教训,例如显示屏选择、输入方式设计、LED指示灯的应用以及软件代码的管理等。最终成品兼具实用性和趣味性,并包含一些彩蛋功能。

阅读更多
硬件 硬件DIY

基于Xilinx 7系列FPGA的PCIe端点实现

2025-03-29
基于Xilinx 7系列FPGA的PCIe端点实现

该项目使用Xilinx 7系列FPGA的PCIE_2_1硬块和GTP收发器实现了PCIe端点,无需专有Vivado IP核,兼容openXC7。设计包含时钟生成模块、GTP收发器和PCIE_2_1硬块,支持PCIe Gen1 x1和Gen2 x1,并在Alinx AC7100B SoM和Wavelet uSDR上进行了测试。项目提供Docker构建和运行脚本,并支持MSI中断和内核驱动。该项目由NGI0 Entrust资助。

阅读更多
硬件 Xilinx

Postgres 语言工具链:提升开发者体验的SQL神器

2025-03-29
Postgres 语言工具链:提升开发者体验的SQL神器

一个名为libpg_query的项目,旨在为Postgres开发提供一套完整的工具链,并基于Postgres自身的解析器libpg_query,确保100%的语法兼容性。该工具链采用服务器-客户端架构,支持多种接口,包括LSP、CLI、HTTP API和WebAssembly模块。目前已实现自动完成、语法错误高亮、类型检查和代码风格检查等功能,未来计划进一步完善这些核心功能,并构建更强大易用的基础设施。

阅读更多
开发

如何在Oracle云上自托管几乎免费的开源TURN服务器

2025-03-28
如何在Oracle云上自托管几乎免费的开源TURN服务器

本文介绍了如何在Oracle云的免费层上自托管一个几乎免费的开源TURN服务器,以替代依赖第三方服务的WebRTC实现。文章详细描述了创建子网、安全列表、实例配置、安装Nginx、Certbot、PeerJS服务器和Coturn服务器的步骤,并讲解了如何配置iptables规则和使用coturn-credential-api进行身份验证,最终实现对WebRTC通信的完全控制,避免依赖Google等大型公司的服务器,增强隐私和安全性。

阅读更多

Hexi:轻量级C++23二进制数据处理库

2025-03-28
Hexi:轻量级C++23二进制数据处理库

Hexi是一个轻量级的C++23仅包含头文件的库,用于安全地处理来自任意来源(主要为网络)的二进制数据。它介于手动从网络缓冲区复制字节和完整的序列化库之间。Hexi的设计目标是易用性、处理不受信任数据时的安全性、合理的灵活性和将开销降至最低。它支持自定义容器,包括非连续容器,并提供异常处理和边界检查以确保安全。Hexi还包含一些额外的功能,例如用于处理二进制文件、静态大小缓冲区和动态大小缓冲区的缓冲区类型,以及一个线程局部块分配器。

阅读更多

6502架构下超小型Forth语言实现

2025-03-28
6502架构下超小型Forth语言实现

本文介绍了一个针对6502 8位CPU的极小化Forth语言实现,其大小仅为数百字节。作者比较了两种不同的内部解释器模型:直接线程代码(DTC)和最小线程代码(MTC),最终选择了DTC以实现更小的代码尺寸。该项目旨在验证标准DTC与MTC变体,并关注代码大小而非性能。最终实现的Forth包含了核心词法单元,并通过`my_hello_world.FORTH`程序进行了测试,展示了其功能。

阅读更多
开发 Forth语言
1 2 27 28 29 31 33 34 35 93 94