Webtagr 前沿科技资讯摘要

GitHub - lkesteloot/turbopascal: Web-based Turbo Pascal compiler. (github.com)

GitHub上的Turbopascal是一个Pascal编译器的开源实现，它支持许多不同的平台，包括DOS、OS/2、Windows、Linux和macOS。该项目包含Turbo Pascal 7.0的完整源代码，以及从那时起对编译器所做的大量修改和更新。它还提供了有关如何编译、安装和使用编译器的详细信息。

36
评论

GitHub - leap71/PicoGK: PicoGK is a compact and robust geometry kernel for Computational Engineering (github.com)

PicoGK是一个用Pico语言编写的游戏引擎，支持2D和3D图形、音频、输入和物理引擎。它易于使用，包含许多示例和文档，非常适合初学者和经验丰富的游戏开发者。

34
评论

GitHub - wireviz/WireViz: Easily document cables and wiring harnesses. (github.com)

WireViz 是一款开源的软件架构可视化工具，基于图论算法，可对代码库进行分析、可视化和度量，帮助用户理解大型代码库的结构和组件之间的关系。

36
评论

GitHub - matan-h/adb-shell: better `adb shell` (github.com)

该网站提供了用于与 Android 设备进行交互的命令行实用程序，允许开发者控制和操作设备。它包含有关安装、使用和示例的文档，帮助用户理解和使用该实用程序。

34
评论

GitHub - purplesyringa/docker-boot: 类似于 `execve`，但用于用户空间 (github.com)

docker-boot是一个类似于execve的工具，它可以将当前运行的系统替换为由Docker镜像构建的内存根文件系统，就像NixOS之于Nix一样。该项目提供了一种使用Docker镜像启动系统的方法，用户可以选择启动带有GUI或不带GUI的系统。

用户空间

根文件系统

GitHub - catatsuy/purl: Streamlining Text Processing (github.com)

这是一个开源的Python库，可用于处理持久URL（PURL）和数字对象标识符（DOI）。它提供了一个易于使用的API，用于解析、验证和创建PURL和DOI，并处理元数据和重定向。该库还包括对常见引用风格的支持，例如APA和MLA。

31
评论

Redka：使用 SQLite 重新实现 Redis (github.com)

Redka 旨在使用 SQLite 重新实现 Redis 的优秀部分，同时保持与 Redis API 的兼容性。其显著特点包括：数据不必完全放在 RAM 中；ACID 事务；SQL 视图以更好地进行自省和报告；进程内（Go API）和独立（RESP）服务器；与 Redis 兼容的命令和线路协议。Redka 目前支持五种核心 Redis 数据类型：字符串、列表、集合、哈希和排序集合，并提供详细的命令列表和用法说明。

39
评论

Redis

GitHub - Evan-Wildenhain/CTRL-F-VIDEO: 视频版 Ctrl-f (github.com)

CTRL-F-VIDEO是一个开源项目，旨在为视频提供类似Ctrl-f的搜索功能。它利用OpenAI的Whisper模型将音频转换为文本，并允许用户搜索特定的单词或短语。该项目目前仅支持YouTube平台，并提供直接匹配、语音相似匹配和所有匹配的选项。虽然语音相似匹配效果有限，但Whisper模型的高效性使得直接匹配功能非常实用。

34
评论

视频搜索

Whisper

PostgreSQL 索引推荐器 (github.com)

PostgreSQL 索引推荐器是一个 PostgreSQL 扩展，用于推荐索引以提高查询性能。该扩展支持泛型参数，例如 $1、$2，支持物化视图，识别被视图混淆的表/列。对于给定的查询，它搜索一组 SQL DDL 创建索引语句，以改进查询的执行时间。

34
评论

索引

GitHub - nanochess/RayTracer: 483字节的光线追踪器（x86引导扇区） (github.com)

文章介绍了作者 Oscar Toledo G. 将 D. Scott Williamson 的 Atari 8 位 BASIC 光线追踪器移植到 x86 引导扇区的项目。该项目生成了一个大小为 483 字节的光线追踪器，可以在 Pentium Pro 及更高版本的计算机以及大多数现代模拟器上运行。作者还介绍了项目的灵感来源、代码优化过程、使用方法以及对贡献者的感谢。

光线追踪

x86 引导扇区

translateLocally：在本地机器上快速安全地翻译 (github.com)

translateLocally是一个基于marian和Bergamot的图形界面翻译工具，可以在本地机器上快速安全地进行翻译。它支持Windows、Linux和Mac系统，并提供命令行和NativeMessaging接口，允许用户下载、导入和管理翻译模型，以及执行翻译操作。

41
评论

marian

Bergamot

GitHub - Hafthor/zsvutil: 用于在 CSV/TSV 与 ZIP 分隔值之间转换的 ZSV 工具 (github.com)

这篇文章介绍了一种名为 ZSV（ZIP 分隔值）的列式数据存储格式，并提供了一个名为 zsvutil 的工具，用于在 CSV/TSV 和 ZSV 文件之间进行转换。ZSV 构建于 TSV 和 ZIP 之上，使其易于理解、创建和使用，同时还能提供现代列式存储格式的查询性能特征。文章详细解释了 ZSV 的设计理念、格式规范以及一些额外的特性，例如常量列、复合列、嵌套数据、行组和元数据。

36
评论

ZSV

Flow-IPC · GitHub (github.com)

GitHub 上的 Flow-IPC 项目是一个开源库，提供了在 Rust 中进行高效进程间通信的 API 和数据结构。Flow-IPC 旨在为 Rust 提供类似于管道、消息队列和共享内存等通信机制，同时利用 Rust 的所有权和借用系统来实现安全性和效率。该库旨在使进程间通信变得简单、高效且安全。

35
评论

GitHub - kimono-koans/dano: 用于媒体文件的 hashdeep/md5tree （但功能更强大） (github.com)

dano是一个用于媒体文件的命令行工具，它可以计算媒体文件中内部流的校验和，并将它们存储在一个格式中，以便以后验证这些校验和。与传统的哈希校验不同，dano 的校验和不受元数据标签、文件名更改或将比特流从一个媒体容器移动到另一个容器的影响。这使得 dano 成为验证媒体文件完整性的强大工具，即使文件已被修改或重新打包。

33
评论

媒体文件

校验和

ffmpeg

GitHub - ad-si/tu: 将自然语言日期/时间字符串转换为 UTC 的 CLI 工具 (github.com)

tu是一个命令行工具，可以将自然语言日期/时间字符串转换为UTC时间。可以用“tu <自然时间/时长>”的格式使用，例如“tu tomorrow”会返回明天UTC时间的字符串。这个工具在与其他工具（如TaskLite）结合使用时特别有用。

36
评论

CLI

GitHub - FyshOS/fynedesk: 基于 Fyne 的 Linux/Unix 全功能桌面环境 (github.com)

FyneDesk 是一个易于使用的 Linux/Unix 桌面环境，采用材料设计，基于 Fyne 工具包构建，易于使用和开发。它使用 Go 语言，欢迎任何贡献或反馈。FyneDesk 需要与 Fyne 相同的依赖项，并需要 arandr、xbacklight 或 brightnessctl、connman-gtk 和 compton 等外部工具来提供完整体验。

35
评论

桌面环境

轻量级

GitHub - azerothcore/azerothcore-wotlk: 完整的开源 MMO 模组化解决方案 (github.com)

AzerothCore是一个开源游戏服务器应用程序和框架，旨在托管大型多人在线角色扮演游戏（MMORPG）。它基于魔兽世界（WoW），力求重现3.3.5a版本的游戏体验。AzerothCore 具有高度模块化设计，允许开发者扩展和定制游戏以满足其需求，或创建独特的游戏体验。AzerothCore 拥有活跃的开发者、贡献者和用户社区，他们通过论坛、Discord 频道和其他交流平台进行协作、分享知识并提供支持。

37
评论

MMORPG

游戏服务器

魔兽世界

GitHub - tinygrad/open-gpu-kernel-modules: NVIDIA Linux open GPU with P2P support (github.com)

该网站是一个开源 GPU 内核模块的集合，由 tinygrad 维护。它提供了一系列经过优化的 GPU 内核，可用于深度学习和高性能计算。这些模块旨在提高机器学习任务的执行效率和可扩展性。

36
评论

使用 ClickHouse 扩展事件引擎 (github.com)

本文介绍了 Lago 使用 ClickHouse 扩展事件引擎的经验。随着 Lago 的规模不断扩大，每分钟需要处理数百万个事件，原有的 Postgres 数据库不堪重负。为了解决性能问题，Lago 引入了 ClickHouse 作为专门处理流式事件的 OLAP 数据库，并保留 Postgres 用于其他数据需求。文章详细阐述了 OLTP 和 OLAP 数据库的区别，ClickHouse 的优势以及 Lago 如何部署和使用 ClickHouse，并提供了一些其他使用 ClickHouse 的开源项目案例。

35
评论

事件引擎

DwarFS：适用于 Linux、Windows 和 macOS 的快速高压缩只读文件系统 (github.com)

DwarFS 是一种只读文件系统，专注于实现非常高的压缩率，尤其适用于高度冗余的数据。它通过使用相似性哈希函数对相似文件进行聚类，并对文件系统块进行分段分析以减少未压缩文件系统的大小。DwarFS 还提供了一个分类框架，可以对文件甚至文件片段进行分类，然后以不同的方式处理各个类别。DwarFS 是高度多线程的，文件系统创建工具和 FUSE 驱动程序都能很好地利用系统中的多个内核。

34
评论

压缩

只读

GitHub - aaronjanse/dns-over-wikipedia: 利用维基百科重定向`.idk`域名 (github.com)

DNS over Wikipedia是一个利用维基百科重定向`.idk`域名的项目。它通过在维基百科上搜索对应网站，并从信息框中提取相关URL来实现重定向。例如，在浏览器地址栏输入`scihub.idk/`，会观察到重定向到`https://sci-hub.tw`（在撰写本文时）。

39
评论

Wikipedia

域名重定向

GitHub - dail8859/NotepadNext: A cross-platform, reimplementation of Notepad++ (github.com)

GitHub 上名为 NotepadNext 的网站主要托管着开源且功能强大的跨平台文本编辑器，该编辑器专为开发和其他任务而设计。该网站提供下载链接、用户指南、常见问题解答和与项目相关的新闻和更新。

37
评论

Open Interpreter - 让 LLM 在本地运行代码 (github.com)

Open Interpreter提供了一种使用计算机的新方法，可让 LLM 在本地运行代码（Python、Javascript、Shell 等）。安装后即可在终端中通过类似 ChatGPT 的界面与 Open Interpreter 聊天。

当前在github.com上🈶️38K个星。

42
评论

Screenshot to Code (github.com)

Screenshot-to-Code 是一款开源AI开发工具，可根据截图自动转化为乱真并实际可用的源代码网页。Screenshot-to-Code利用GPT-4生成代码，并使用DALL-E3生成外观相似的图像。用户甚至可以直接输入要克隆的网站URL即可。

38
评论

GenAct：用于生成参与性代理的框架 (github.com)

GenAct 是一个用于生成参与性代理的框架。参与性代理是在各种环境中执行任务的自主实体。GenAct 框架提供了一组可重用的组件，可用于构建和训练参与性代理。这些组件包括用于生成动作、感知环境和学习新技能的模块。GenAct 框架是开源的，可以在 GitHub 上获得。

生成对抗网络

神经机器翻译

数据集

人工智慧

生成式对抗网络

Nutlope/roomGPT (github.com)

Nutlope/roomGPT是一个有助于在使用GPT-3进行对话AI开发时构建房间或空间的存储库。它提供了用于创建房间、跟踪用户和管理对话状态的API。还可以使用预先构建的UI组件轻松自定义房间的外观和感觉。

46
评论

房间逃脱

房间

对话AI