本文介绍了 Lago 使用 ClickHouse 扩展事件引擎的经验。随着 Lago 的规模不断扩大,每分钟需要处理数百万个事件,原有的 Postgres 数据库不堪重负。为了解决性能问题,Lago 引入了 ClickHouse 作为专门处理流式事件的 OLAP 数据库,并保留 Postgres 用于其他数据需求。文章详细阐述了 OLTP 和 OLAP 数据库的区别,ClickHouse 的优势以及 Lago 如何部署和使用 ClickHouse,并提供了一些其他使用 ClickHouse 的开源项目案例。
DwarFS 是一种只读文件系统,专注于实现非常高的压缩率,尤其适用于高度冗余的数据。它通过使用相似性哈希函数对相似文件进行聚类,并对文件系统块进行分段分析以减少未压缩文件系统的大小。DwarFS 还提供了一个分类框架,可以对文件甚至文件片段进行分类,然后以不同的方式处理各个类别。DwarFS 是高度多线程的,文件系统创建工具和 FUSE 驱动程序都能很好地利用系统中的多个内核。
DNS over Wikipedia是一个利用维基百科重定向`.idk`域名的项目。它通过在维基百科上搜索对应网站,并从信息框中提取相关URL来实现重定向。例如,在浏览器地址栏输入`scihub.idk/`,会观察到重定向到`https://sci-hub.tw`(在撰写本文时)。
GitHub 上名为 NotepadNext 的网站主要托管着开源且功能强大的跨平台文本编辑器,该编辑器专为开发和其他任务而设计。该网站提供下载链接、用户指南、常见问题解答和与项目相关的新闻和更新。
Open Interpreter提供了一种使用计算机的新方法, 可让 LLM 在本地运行代码(Python、Javascript、Shell 等)。安装后即可在终端中通过类似 ChatGPT 的界面与 Open Interpreter 聊天。
当前在github.com上🈶️38K个星。
Screenshot-to-Code 是一款开源AI开发工具,可根据截图自动转化为乱真并实际可用的源代码网页。Screenshot-to-Code利用GPT-4生成代码,并使用DALL-E3生成外观相似的图像。用户甚至可以直接输入要克隆的网站URL即可。
GenAct 是一个用于生成参与性代理的框架。参与性代理是在各种环境中执行任务的自主实体。GenAct 框架提供了一组可重用的组件,可用于构建和训练参与性代理。这些组件包括用于生成动作、感知环境和学习新技能的模块。GenAct 框架是开源的,可以在 GitHub 上获得。
Nutlope/roomGPT是一个有助于在使用GPT-3进行对话AI开发时构建房间或空间的存储库。它提供了用于创建房间、跟踪用户和管理对话状态的API。还可以使用预先构建的UI组件轻松自定义房间的外观和感觉。