VLM Run Hub:预定义 Pydantic 模式,简化视觉数据提取

2025-02-20
VLM Run Hub:预定义 Pydantic 模式,简化视觉数据提取

VLM Run Hub是一个综合性的预定义Pydantic模式仓库,用于从图像、视频和文档等非结构化视觉领域提取结构化数据。它专为视觉语言模型(VLM)设计,并针对实际用例进行了优化,简化了视觉ETL与工作流程的集成。该平台提供各种预定义模式,例如用于提取发票元数据的Invoice模式,并支持多种VLM,例如OpenAI的GPT-4o和Anthropic的Claude Vision。通过使用Pydantic模式,可以确保数据提取的准确性和可靠性,并简化后续工作流程。

阅读更多
开发

Postgres 开发利器:强大的语言服务器协议实现

2025-02-19
Postgres 开发利器:强大的语言服务器协议实现

一个专注于开发者体验和可靠SQL工具的Postgres语言工具集合及语言服务器协议(LSP)实现。该项目基于Postgres自身的解析器libpg_query构建,确保100%的语法兼容性,采用服务器-客户端架构和与传输无关的设计,支持LSP、CLI、HTTP API和WebAssembly等多种接口。目前已实现自动完成、语法错误高亮、类型检查和类似Squawk的代码检查器等功能,未来计划完善核心功能并构建易于访问的基础设施。

阅读更多
开发 SQL工具

BloodFlowTrixi.jl: 基于Trixi.jl的高性能血管血流模型

2025-02-19
BloodFlowTrixi.jl: 基于Trixi.jl的高性能血管血流模型

BloodFlowTrixi.jl是一个Julia包,实现了用于动脉循环的一维和二维血流模型。这些模型源于Navier-Stokes方程,作为应用数学博士研究的一部分开发,重点关注动脉瘤和狭窄等心血管疾病。该软件包提供基于Trixi.jl框架的离散伽辽金方法的数值模拟,支持曲线几何形状和顺应性壁动力学,并包含一维和二维模型,未来计划扩展到三维流固耦合模型和血管网络模拟。

阅读更多

Mastra:一个构建AI应用的Typescript框架

2025-02-19
Mastra:一个构建AI应用的Typescript框架

Mastra是一个基于Typescript的AI应用开发框架,它提供了一套构建AI应用所需的基本组件:工作流程、智能体、RAG、集成和评估。你可以本地运行Mastra,也可以将其部署到无服务器云平台。Mastra的核心功能包括:LLM模型集成、支持多种LLM提供商;智能体系统,允许LLM模型调用工具、工作流程和同步数据;可类型化的工具函数;持久化的图型化状态机工作流程;RAG知识库构建;预构建的第三方服务API客户端;以及基于模型、规则和统计方法的自动化评估功能。Mastra提供CLI工具`create-mastra`快速创建应用,并通过`mastra dev`打开Playground。

阅读更多
开发 AI框架

Subtrace:你的Docker容器的Wireshark

2025-02-19
Subtrace:你的Docker容器的Wireshark

Subtrace是一款针对Docker容器的网络流量分析工具,类似于Wireshark。它允许开发者查看后端服务器的所有进出请求,从而更快地解决生产问题。Subtrace无需代码更改即可开箱即用,支持所有编程语言,并显示完整的负载、头部、状态码和延迟,性能开销小于100微秒。它基于ClickHouse构建,并以开源方式提供,但目前不接受代码贡献。

阅读更多
开发

Go-msquic:微软QUIC库的Go语言封装

2025-02-19
Go-msquic:微软QUIC库的Go语言封装

go-msquic是微软QUIC库的Go语言封装,为Go开发者提供了一个易于使用的接口来处理基于QUIC的协议,例如HTTP/3。它借鉴了quic-go的API设计,可以作为直接替换。除非你准备处理C库,否则我们实际上推荐使用quic-go而不是go-msquic。安装需要先构建本地MsQuic C库,然后使用`go get github.com/noboruma/go-msquic`安装。示例代码位于sample/目录下。

阅读更多
开发

OpenArc:轻量级推理 API 后端,加速 Intel 设备上的大型语言模型

2025-02-19
OpenArc:轻量级推理 API 后端,加速 Intel 设备上的大型语言模型

OpenArc 是一个轻量级的推理 API 后端,利用 OpenVINO 运行时和 OpenCL 驱动程序,在 Intel CPU、GPU 和 NPU 上加速 Transformers 模型的推理。它针对智能体应用场景而设计,具有类型安全的 FastAPI 实现,并提供模型加载、卸载、文本生成和状态查询等功能。OpenArc 简化了机器学习代码与应用逻辑的解耦,并提供与 Ollama、LM-Studio 和 OpenRouter 类似的工作流程。它支持自定义模型和角色,并提供丰富的功能扩展,例如添加 OpenAI 代理、支持视觉模型等。

阅读更多

Augment:Vim/Neovim插件,AI赋能代码补全与代码聊天

2025-02-19
Augment:Vim/Neovim插件,AI赋能代码补全与代码聊天

Augment发布了其Vim/Neovim插件,该插件利用AI提供代码补全和多轮对话功能,能根据你的代码库上下文提供智能建议。安装后,你需要添加工作区文件夹并登录Augment服务。然后,你就可以在编写代码时获得上下文感知的代码补全建议,并使用`:Augment chat`命令与AI进行代码相关的多轮对话。插件支持Vim 9.1.0+和Neovim 0.10.0+,并需要Node.js 22.0.0+。你可以通过`git clone`或插件管理器安装,并配置工作区文件夹以提高准确性。插件还提供了丰富的命令,例如状态查看、登录注销、启用禁用建议、查看日志、开启新的聊天会话等。对于大型项目,你可以使用`.augmentignore`文件忽略某些文件或目录。

阅读更多

大型语言模型在Set游戏中挑战失败,推理模型逆袭成功

2025-02-19
大型语言模型在Set游戏中挑战失败,推理模型逆袭成功

近期一项实验测试了大型语言模型(LLM)在Set游戏中的推理能力。Set是一款需要玩家从12张卡牌中找出三张符合特定规则的卡牌的游戏。实验结果显示,GPT-4o、Sonnet-3.5和Mistral等LLM均未能成功识别出所有Set组合,甚至出现了错误答案。然而,新型推理模型DeepThink-R1和o3-mini却成功解决了这个问题,准确地识别出所有Set组合,展现了其强大的逻辑推理能力。这表明,虽然LLM在自然语言处理方面表现出色,但在复杂的逻辑推理任务上仍存在不足,而专注于推理的模型则具有明显的优势。

阅读更多

RustOwl:可视化Rust代码所有权和生命周期

2025-02-18
RustOwl:可视化Rust代码所有权和生命周期

RustOwl是一款强大的工具,它可以可视化Rust代码中变量的所有权和生命周期。通过颜色编码的下划线,RustOwl直观地展示变量的生命周期、不可变借用、可变借用以及值移动等信息,方便开发者进行调试和优化。它支持VSCode、Neovim和Emacs等编辑器,并提供多种安装方式,包括简单的命令行安装和从源代码手动安装。虽然在某些情况下可能存在少量显示问题,但RustOwl已经证明了其在提高Rust开发效率方面的巨大潜力。

阅读更多
开发

mt32-pi 项目停止更新:开发者不堪网络暴力

2025-02-17
mt32-pi 项目停止更新:开发者不堪网络暴力

由于持续遭受网络暴力,包括人身攻击、代码盗用和3D打印设计被盗卖等,mt32-pi 项目开发者宣布停止更新该项目。mt32-pi 是一个基于 Raspberry Pi 的裸机 MIDI 合成器,旨在模拟著名的 Roland MT-32 音频模块。开发者表示,网络暴力严重影响了其身心健康,已无法继续维护该项目。

阅读更多
开发

在NES上运行ELKS:NES86项目详解

2025-02-17
在NES上运行ELKS:NES86项目详解

NES86项目令人惊叹地将IBM PC模拟器移植到了NES游戏机上!它通过模拟Intel 8086处理器和相关硬件,成功运行了嵌入式Linux内核子集(ELKS),甚至包括shell和实用工具。这意味着你可以在老旧的NES上体验到部分x86软件,虽然仅限于简单的串口终端。该项目开源,并提供了详细的构建步骤,包括ELKS镜像的编译和NES86 ROM的生成。准备好迎接挑战,在复古硬件上运行现代操作系统吧!

阅读更多
开发 ELKS

可视化大型语言模型R1的思维过程

2025-02-17
可视化大型语言模型R1的思维过程

研究人员通过将R1的思维链保存为文本,转换成OpenAI API的嵌入向量,并使用t-SNE进行可视化,实现了对大型语言模型R1“思考过程”的可视化。通过计算连续步骤之间的余弦相似度,他们观察到R1的思考过程可能包含“搜索”、“思考”和“总结”三个阶段。这项研究利用了十个不同的提示,包括描述自行车工作原理、设计新型交通工具等,并提供了获取思维链数据和代码的方法。

阅读更多

Bag of Words:用AI构建和分享智能数据应用

2025-02-17
Bag of Words:用AI构建和分享智能数据应用

Bag of Words是一个强大的工具,允许用户仅用一个提示就能创建全面的数据看板,并进行迭代式改进。它能无缝集成各种数据源,包括数据库、API和业务系统,从而有效利用数据。关键特性包括自然语言查询、看板管理和多种LLM兼容性(OpenAI、Anthropic等)。该项目提供Docker部署和详细的Python/Node.js环境搭建指南,采用AGPL-3.0许可证。

阅读更多

Umami:一款注重隐私的Google Analytics替代方案

2025-02-17
Umami:一款注重隐私的Google Analytics替代方案

Umami是一个简单、快速且注重隐私的Google Analytics替代品。它支持MariaDB、MySQL和PostgreSQL数据库,安装过程简单,只需克隆GitHub仓库、安装依赖项并配置数据库连接即可。默认情况下,它会在http://localhost:3000启动。同时提供Docker镜像,方便用户部署。Umami提供详尽的入门指南,方便用户快速上手。

阅读更多
开发

提升Shell命令效率的小技巧:用图标快速识别历史命令

2025-02-16
提升Shell命令效率的小技巧:用图标快速识别历史命令

频繁在Shell历史记录中查找并重新运行命令?作者分享了一个巧妙的技巧:在命令前添加图标或文字标识符(例如:✅; ./utils/check.sh)。这些标识符不影响命令执行,却能显著提升视觉识别效率,快速找到所需命令,有效缓解了频繁翻阅历史记录的困扰。这是一个简单却实用的提升Shell使用效率的方法。

阅读更多

轻量级配置管理工具Remco:etcd和Consul的完美伴侣

2025-02-16
轻量级配置管理工具Remco:etcd和Consul的完美伴侣

Remco是一款轻量级的配置管理工具,受confd启发,它能够使用存储在etcd或Consul等键值存储中的数据来保持本地配置文件的最新状态,并处理模板资源,自动重新加载应用程序以获取新的配置文件更改。与confd相比,Remco支持每个模板资源使用多个源/目标对,以及每个模板资源使用多个后端,并采用Pongo2模板引擎。此外,它还具有僵尸进程清理支持、插件扩展后端功能以及使用JavaScript轻松创建自定义模板过滤器的能力。安装方式简单,支持从源码构建和下载预编译版本。

阅读更多
开发 etcd Consul

Gixy:Nginx 配置安全审计工具

2025-02-16
Gixy:Nginx 配置安全审计工具

Gixy 是一个用于分析 Nginx 配置的工具,旨在预防安全错误配置并自动化缺陷检测。它支持 Python 3.6-3.13 版本,主要在 GNU/Linux 系统上测试。Gixy 可检测多种 Nginx 配置问题,例如 HTTP 分裂漏洞。安装方式多样,支持 pip、yum 和 Docker。用户可指定配置文件路径或使用管道输入,并可跳过特定测试。Gixy 积极维护,欢迎贡献代码和改进文档。

阅读更多
开发

Gulf of Mexico编程语言:颠覆编程规则的奇特设计

2025-02-16
Gulf of Mexico编程语言:颠覆编程规则的奇特设计

DreamBerd更名为Gulf of Mexico,这是一种奇特的编程语言,其特性包括:以感叹号结尾语句,分号作为“非”运算符,四种声明类型(常量常量、常量变量、变量常量、变量变量),数组从-1开始索引,支持浮点数索引,使用`when`关键字检查变量变化,内置垃圾回收器,支持自定义变量生命周期,以及独特的负生命周期变量提升机制。此外,它没有循环语句,安装过程十分复杂,布尔值包含“maybe”,使用空格表示算术运算优先级,支持分数和数字名称,强制缩进为3个空格,支持多种比较运算符,函数声明方式灵活,除以零返回undefined,字符串声明方式多样,支持区域货币插值,类型注解仅供参考,支持正则表达式类型,以及`previous`、`next`和`current`关键字访问变量历史值。代码可通过五个或更多等号分割成多个文件,支持代码逆向执行,支持全局变量,自动插入感叹号、括号和引号等。Gulf of Mexico还支持富文本和异步函数的轮流执行机制。

阅读更多
开发 奇特设计

OmniParser V2:基于纯视觉的GUI代理的屏幕解析工具

2025-02-15
OmniParser V2:基于纯视觉的GUI代理的屏幕解析工具

OmniParser 是一个用于将用户界面截图解析成结构化易于理解的元素的综合方法,这显著增强了 GPT-4V 生成可准确落地到界面相应区域的动作的能力。最近更新的 OmniParser V2 实现了在 Screen Spot Pro 基准测试中 39.5% 的最新技术水平,并推出了 OmniTool,允许用户通过选择的视觉模型控制 Windows 11 虚拟机。该项目提供了详细的安装说明和演示,模型权重可在 Hugging Face 上获取。

阅读更多

Schemesh:Lisp与Unix Shell的完美融合

2025-02-15
Schemesh:Lisp与Unix Shell的完美融合

Schemesh是一个交互式Shell,可以使用Lisp进行脚本编写。它旨在替代bash、zsh等传统Unix Shell,提供用户友好的交互式行编辑、自动补全和历史记录等功能。同时,它无缝集成了Chez Scheme驱动的完整Lisp REPL,方便用户处理复杂任务。Schemesh允许用户在Shell语法和Lisp语法之间无缝切换,并提供丰富的函数来管理Unix进程。对于复杂的脚本和编程任务,它用功能强大的Lisp REPL取代了传统Shell脚本语言,极大提高了效率和可靠性。

阅读更多
开发

Jill:Nand2Tetris平台上的全新函数式编程语言

2025-02-15
Jill:Nand2Tetris平台上的全新函数式编程语言

Jill 是一种为 Nand2Tetris 平台设计的函数式编程语言,作为原 Jack 高级语言的替代品。它与 Jack 使用相同的虚拟机指令集和底层 HACK 架构,并遵循类似的设计原则(牺牲易用性以换取易于实现),同时提供 Jack 面向对象、冗长风格的替代方案。Jill 的特性包括:一等函数、优化的尾递归、代数数据类型和模式匹配。它具有简洁的设计,只有类型、变量和函数三个主要概念。编译后,项目生成的 .vm 文件将位于 /bin 目录中。可以使用 `cargo run -- path_to_jill_project_root` 或 `jillc [path_to_jill_project_root]` 命令编译 Jill 代码。

阅读更多
开发 Nand2Tetris

Synergetica:端到端基因电路设计桌面应用

2025-02-15
Synergetica:端到端基因电路设计桌面应用

Synergetica 是一款强大的基因电路设计桌面应用程序,提供端到端的流程,允许用户在一个平台上设计电路、运行模拟和生成 DNA 序列。它支持基于节点或代码的界面进行基因电路设计,交互式模拟蛋白质表达水平,并根据模拟确定的参数生成 DNA 序列。用户可以自定义电路,添加符合其需求的基因部件,并且可以在完全离线的情况下工作,确保完全的控制和隐私。

阅读更多

Kreuzberg:一款强大的本地文档文本提取Python库

2025-02-15
Kreuzberg:一款强大的本地文档文本提取Python库

Kreuzberg是一个强大的Python库,用于从各种文档中提取文本。它提供了一个统一的异步接口,支持PDF、图像、办公文档等多种格式。该库注重本地处理,无需依赖外部API或云服务,资源效率高,依赖项少,并支持批量处理。Kreuzberg还具有智能的PDF文本提取方法,先尝试直接提取文本,如果失败则自动回退到OCR。它提供了全面的错误处理和丰富的功能,例如异步/同步API、元数据提取和并发处理。

阅读更多
开发 文本提取

Goku:基于修正流转换器的视频生成基础模型

2025-02-15
Goku:基于修正流转换器的视频生成基础模型

字节跳动和港大团队推出Goku,一个基于修正流转换器的图像和视频生成模型家族。Goku利用精心策划的数据、先进的模型设计和流公式,实现了业界领先的视觉生成性能。它支持文本到视频、图像到视频和文本到图像生成,并在GenEval、DPG-Bench和VBench等主要基准测试中取得了顶尖成绩,其中Goku-T2V在VBench上得分高达84.85,位居第二。

阅读更多

VS Code AI 调试扩展:LLM Debugger

2025-02-15
VS Code AI 调试扩展:LLM Debugger

LLM Debugger 是一款 VS Code 扩展,它利用大型语言模型 (LLM) 实现程序的主动调试。不同于传统仅分析静态代码的 LLM 调试方法,LLM Debugger 提供实时运行时上下文,包括变量值、函数行为、分支决策等,从而帮助 LLM 更快更准确地诊断错误。该扩展还能通过运行代码并捕获执行细节来生成合成数据,提供对程序行为的独特见解。它集成了实时调试信息、自动断点管理、运行时检查和调试操作等功能,并提供一个侧边栏面板显示 AI 调试会话的状态和 LLM 的建议。LLM Debugger 虽然是一个研究实验,但展示了结合实时调试数据和 LLM 功能如何彻底改变传统调试实践的潜力。

阅读更多
开发 AI 调试

Rust编写的高性能Ping工具Nping:实时可视化网络延迟

2025-02-15
Rust编写的高性能Ping工具Nping:实时可视化网络延迟

Nping是一款用Rust编写的强大Ping工具,它支持并发Ping多个地址,并提供实时数据更新和可视化图表显示。Nping不仅能显示最大、最小、平均延迟以及丢包率等关键指标,还支持IPv4和IPv6,以及根据平均延迟对多个地址的结果进行排序。此外,它还具有主机子命令,可以显示域名对应的IP地址详细信息,并支持自定义Ping次数和间隔。无论是网络管理员还是开发者,Nping都是一款提升网络诊断效率的利器。

阅读更多
开发 Ping

VimLM:Vim编辑器中的本地LLM编码助手

2025-02-15
VimLM:Vim编辑器中的本地LLM编码助手

VimLM是一款基于本地LLM模型的Vim编码助手,类似于GitHub Copilot。它将上下文代码理解、总结和AI辅助集成到Vim工作流程中。支持多种MLX兼容模型,具有Vim原生用户体验,并支持离线运行,保证安全性。用户可以通过简单的快捷键与模型交互,进行代码转换、生成、总结等操作,并能处理复杂的上下文信息,包括当前文件、选定代码块、引用文件和项目目录结构。

阅读更多
开发 编码助手

Yash:一款追求极致POSIX兼容性的全新Shell

2025-02-15
Yash:一款追求极致POSIX兼容性的全新Shell

Yash是一个用C99编写的、追求极致POSIX兼容性的命令行Shell。它支持全局别名、数组、多种重定向方式、括号扩展、扩展通配符、分数运算等特性,并提供命令补全、命令预测等实用功能。Yash在GitHub上维护,已达到POSIX.1-2008标准的绝大部分要求,并定期发布维护更新。它可以在多种POSIX环境下编译运行,目前主要在Fedora、macOS和Cygwin上测试。安装后,用户可以通过配置文件自定义环境变量、别名、提示符等。

阅读更多
开发

浏览器扩展程序:对抗跨性别者抹杀

2025-02-14
浏览器扩展程序:对抗跨性别者抹杀

一款名为“Marsha P Johnson”的浏览器扩展程序旨在对抗对跨性别者的抹杀。它通过将“LGB”替换为“LGBTQ+🧱”来突出这种现象。该扩展程序的创建者指出,美国政府正在积极从政府网站上删除对跨性别者的提及,甚至从石墙国家纪念碑网站上删除了“TQ+”。这是一种公然的抹杀行为,而该扩展程序则旨在让用户注意到这种审查制度。

阅读更多
杂项 LGBTQ+
1 2 35 36 37 39 41 42 43 93 94