Cuss:多语言脏话检测库
Cuss是一个开源库,提供多种语言的脏话、侮辱性词汇及其置信度评分。它并非用于构建脏话过滤器(作者认为这种过滤器很糟糕),而是用于自然语言处理研究。该库支持多种安装方式,包括npm、esm.sh等,并包含多种语言版本(英语、阿拉伯语、西班牙语、法语、意大利语、葡萄牙语等),每个词汇都标注了0到2的置信度评分,表示其作为脏话的可能性。此外,该库还包含一些其他词汇列表,例如流行语、常用词等。
阅读更多
Cuss是一个开源库,提供多种语言的脏话、侮辱性词汇及其置信度评分。它并非用于构建脏话过滤器(作者认为这种过滤器很糟糕),而是用于自然语言处理研究。该库支持多种安装方式,包括npm、esm.sh等,并包含多种语言版本(英语、阿拉伯语、西班牙语、法语、意大利语、葡萄牙语等),每个词汇都标注了0到2的置信度评分,表示其作为脏话的可能性。此外,该库还包含一些其他词汇列表,例如流行语、常用词等。
阅读更多
Kan是一个开源的项目管理工具,旨在成为Trello的强大替代品。它提供了看板视图、成员协作、Trello导入、标签过滤、评论、活动日志等功能,并计划推出模板和集成。该项目代码已开源,欢迎贡献!
阅读更多
本文汇集了众多工具、库、数据集和资源,旨在帮助研究人员更有效地发现、阅读和处理arXiv上的科学论文。从语义搜索引擎到交互式文献地图,再到AI辅助阅读和摘要工具,应有尽有,涵盖了论文发现、阅读增强、文献综述生成等多个方面。此外,还包含多个大型数据集,为科研人员提供数据支持。
阅读更多
一款名为 PhoneAgent 的 iOS 应用利用 OpenAI 的 GPT-4.1 模型,通过访问 iOS 设备的辅助功能树,实现跨应用操作,例如发送信息、下载应用、拨打电话等。它无需越狱,利用 Xcode 的 UI 测试框架与系统交互,但仍处于实验阶段,存在一些已知问题,例如处理长时间任务和动画等。该应用将应用内容发送至 OpenAI API,并通过 TCP 服务器与 UI 测试进行通信。
阅读更多
HIP是一个C++运行时API和内核语言,允许开发者从单一源码创建可在AMD和NVIDIA GPU上运行的应用程序。它具有高性能、单一源码C++编程语言支持、平台最佳开发环境和工具支持等特点。HIPIFY工具可自动将CUDA源码转换为HIP源码,开发者也可以针对特定平台进行性能调优。HIP既支持新项目的开发,也提供便捷的CUDA代码移植工具,但并非CUDA的直接替代品,仍需手动编码和性能调整。
阅读更多
Agno是一个用于构建具有记忆、知识和推理能力的多智能体系统的全栈框架。它支持五级智能体系统,从简单的工具代理到具有协作能力的团队代理,并提供多种工具和模型集成。Agno具有模型无关性、高性能、内置推理、多模态支持、高级多智能体架构等特点,并支持实时监控。其高效的性能使其成为构建高性能智能体系统的理想选择。
阅读更多
这是一个使用线性反馈移位寄存器 (LFSR) 而不是程序计数器的FPGA CPU 项目。该CPU运行一个完整的Forth解释器,并以151.768MHz的频率运行在Spartan-6 FPGA上。其核心仅占用27个切片,体积小巧。项目包含VHDL代码,GHDL模拟器以及Xilinx ISE 14.7的构建说明。该项目展示了使用LFSR作为程序计数器来节省资源的可能性,并提供了一个简洁高效的Forth解释器实现。
阅读更多
MBCompass是一款使用Jetpack Compose构建的轻量级指南针应用,它摒弃了市面上大多数指南针应用臃肿的广告和过多的功能,专注于提供精准、高效的指南针服务。它利用设备的磁力计和加速计提供实时的地磁场更新,并支持多种功能,例如显示用户当前位置(使用OpenStreetMap)、明暗主题切换、显示磁场强度、保持屏幕常亮、横向显示以及平滑的指南针旋转。此外,它还通过传感器融合技术提高精度,并且完全免费,无广告,也无应用内购买。
阅读更多
一个名为`moonphase`的项目提供了多种编程语言的代码片段,用于计算月相。这些代码基于John Walker在80年代编写的moontool程序的算法,并参考了《Practical Astronomy With Your Calculator》一书。该项目支持系统级语言、脚本语言和DSL,所有实现都包含测试用例,并能计算月球的照亮部分。项目强调代码的简洁性和自包含性,方便用户直接复制粘贴使用。
阅读更多
Memvid 颠覆了传统的 AI 内存管理方式,它将文本数据编码成视频,从而实现对百万级文本片段的闪电般语义搜索,检索时间仅需亚秒级。与占用大量 RAM 和存储空间的传统向量数据库不同,Memvid 将知识库压缩成紧凑的视频文件,同时保持对任何信息的即时访问。它支持 PDF 文件导入、多种大型语言模型、离线优先模式,并提供简洁的 API 接口。无论是构建个人知识库,还是处理大型数据集,Memvid 都能提供高效、便捷的解决方案,是 AI 领域的一场内存管理革命。
阅读更多
ZenTransfer是一款免费的Mac和Windows文件传输工具,专为专业摄影师设计。它可以清空SD卡并确保3-2-1备份,按日期整理文件到文件夹,上传文件到AWS S3、Azure、Google Cloud Platform等云平台,并通过zentransfer.io中继到多个FTP或云服务。目前该软件处于测试阶段,开发者Chris希望通过收集用户反馈来决定是否继续开发并添加更多功能。
阅读更多
pkmn是一个用Zig语言编写的超高速口袋妖怪对战模拟引擎,其速度比修改后的Pokémon Showdown模拟器快1000多倍。它旨在精确模拟初代游戏和Pokémon Showdown在线模拟器的对战规则,并提供TypeScript的参考驱动程序。该引擎并非全功能模拟器,而是一个低级库,可用于构建更高级的应用。目前支持第一和第二世代的对战,未来计划支持更多世代。
阅读更多
这款浏览器扩展程序允许用户基于正则表达式或通配符模式自定义URL重定向规则。它可以用来屏蔽广告、跳转到网站的桌面版本、简化DuckDuckGo搜索等。例如,它可以将YouTube Shorts链接重定向到常规YouTube页面,或者将包含特定关键词的Google搜索重定向到DuckDuckGo。该扩展程序还包含一些预设的规则,方便用户快速上手。
阅读更多
tldx是一个命令行工具,可以快速生成并检查域名的可用性。它支持自定义前缀、后缀和顶级域名(TLD),并能并行检查多个域名。用户只需输入关键词,tldx就能快速返回可用的域名组合,极大地方便了创业者和开发者寻找合适的域名。tldx支持macOS、Linux和Windows系统,安装方式简单,通过brew或手动下载安装包即可使用。
阅读更多
Nature 是一款开源的通用编程语言,旨在提供优雅简洁的开发体验,让开发者轻松高效地构建安全可靠的跨平台软件。它借鉴了 Go 语言的优点,例如高性能的运行时和垃圾回收机制,同时改进了一些 Go 的不足,例如更强大的类型系统和更便捷的错误处理。Nature 已经达到早期可用版本,支持 Linux 和 macOS 平台,并提供丰富的标准库和示例项目。它适合游戏开发、科学计算、AI、操作系统和 Web 开发等领域。
阅读更多
ovld 是一个为 Python 打造的超高速多重分发库,它使用注解而不是笨拙的 `isinstance` 语句来为每个类型签名编写相同函数的不同版本。与 Python 的 `singledispatch` 不同,它支持多个参数。ovld 速度极快,支持函数、方法、位置参数和关键字参数的分发,甚至还支持依赖类型和代码生成。它尤其擅长递归定义,例如树映射或序列化,并允许创建函数变体和混合体,以实现更灵活的功能扩展。
阅读更多
一个开源项目对MySQL 8.0进行了全面的性能优化,解决了自8.0.28版本以来存在的连接性能下降、批量插入性能问题以及其他一些性能瓶颈。优化涵盖InnoDB存储引擎可扩展性、redo日志、哈希连接成本模型、内存使用和高可用性等多个方面。测试表明,该优化版本在高性能硬件上尤其有效,为用户提供更稳定、高效的服务,尤其适用于互联网公司的高并发场景。该项目还提供持续的版本维护和易于使用的二进制版本下载。
阅读更多
Berb 是一款轻量级的、注重隐私的 Web 应用,使用 WebRTC 技术实现点对点文件传输。无需服务器上传,文件直接在发送者和接收者之间传输。它安全快速,因为文件不会经过任何服务器。目前该项目仍处于开发阶段,未来计划增加断线重连、多文件支持和流保存等功能。
阅读更多
一个名为 OpenADP 的开源项目旨在为每个人提供高级数据保护,抵抗国家级攻击和秘密大规模监控。该项目采用分布式信任系统,将用户的加密密钥分成多个份额,存储在不同的保护服务器上。用户需要从足够数量的服务器中获取密钥份额才能恢复数据。目前项目需要 Android 和 iOS 客户端开发人员以及愿意运行保护服务器的人员。这是一个雄心勃勃的项目,旨在增强用户的隐私和数据安全,欢迎各位开发者加入!
阅读更多
pckb项目提供了一种将128位信息备份到物理介质(打孔卡)的新奇方法。用户只需使用提供的HTML工具生成打孔图案,然后用钻头在铝片上打孔即可。恢复密钥同样简单,只需将打孔卡的图案输入HTML工具即可。该项目也提供了解决大于128位密钥的方案,以及详细的FAQ解答。
阅读更多
Rigorous是一个利用AI进行科学论文分析的工具,提供云端版本,用户只需上传稿件和目标期刊信息,即可在1-2个工作日内收到一份全面的PDF报告。该工具包含两个主要部分:Agent1_Peer_Review负责进行同行评审,提供详细的反馈和可操作的建议;Agent2_Outlet_Fit(开发中)则用于评估稿件与目标期刊的匹配度。目前Agent1_Peer_Review已可使用,并能生成包含摘要、详细分析和视觉化表格的专业PDF报告。
阅读更多
厌倦了现代Web开发的复杂流程,一位资深程序员决定回归简单。他用Sinatra、Sequel和SQLite构建了一个简单的排名系统,重温了2007年Web开发的乐趣。没有复杂的MVC框架,没有庞大的数据库,只有轻量级的代码和快速的响应。他巧妙地利用了现代硬件的性能优势,用最简单的技术实现了令人满意的效果,这让他体验到了久违的编程乐趣,并重新燃起了对编程的热情。
阅读更多
turtlesim_agent是一个AI代理,它将经典的ROS turtlesim模拟器变成了一个由自然语言驱动的创意画布。借助LangChain,这个AI代理可以解释基于文本的指令,并将它们转换成视觉图画,让模拟海龟变成一位数字艺术家。用户可以用简单的英语描述形状或绘画意图,AI代理会推理这些指令,并使用turtlesim的运动命令来执行它们。该项目探索了大型语言模型如何与外部环境交互以展现创造性行为。
阅读更多
这个GitHub仓库汇集了作者日常工作中使用的各种实用工具、脚本、文档和技巧,内容涵盖Bash、Zsh、网络工具、安全工具、数据库工具等等。它就像一本程序员的秘密宝典,为系统和网络管理员、DevOps工程师、渗透测试人员和安全研究人员提供了丰富的资源,并持续更新。
阅读更多
本文详细分析了 Linear 的同步引擎 (LSE),它巧妙地解决了任意数据模型的支持、丰富的功能(包括部分同步、权限控制、撤销/重做、离线可用性和编辑历史记录)以及良好的开发者体验等难题。作者通过逆向工程 Linear 的前端代码,深入探讨了 LSE 的模型定义、MobX 的使用、引导过程、本地数据库的构建、延迟加载数据、客户端与服务器的同步、撤销/重做等机制。文章还解释了 LSE 如何定义模型和元数据、执行引导和延迟加载,以及处理事务、增量更新和冲突解决。LSE 的设计目标是让开发者无需成为同步引擎专家就能构建协作应用程序。
阅读更多
Icepi Zero是一款经济实惠的FPGA开发板,采用Raspberry Pi Zero的尺寸,搭载Lattice ECP5 25F芯片,拥有强大的设计能力。它还配备HDMI接口,方便数字视频输出。不同于市面上昂贵且笨重的FPGA开发板,Icepi Zero小巧便携,适合学生学习、游戏玩家模拟硬件、程序员测试代码等多种用途。板载USB转JTAG转换器,无需外部编程器,且完全开源。
阅读更多
Asdf Overlay是一个超高速、易于使用的Windows窗口叠加库,通过Hook渲染后端在窗口帧缓冲区上绘制。它利用GPU共享纹理避免CPU的帧缓冲区复制,从而能够渲染任意大小的叠加层而不会损失性能。支持OpenGL、DX9-DX12和Vulkan等多种API,并提供输入捕获控制等功能。目前已被多个项目使用,例如游戏内歌词叠加和游戏内叠加等。该库需要Node.js、pnpm、特定版本的Rust编译器和MSVC等环境。安装依赖后,通过pnpm build进行构建,并提供多种示例和调试方法。
阅读更多
Sequor是一个以SQL为中心的流程平台,用于在现代数据栈中构建可靠的API集成。它提供了对黑盒SaaS连接器的开放替代方案,使数据团队能够完全控制其集成管道。Sequor将API执行与数据库融合,支持API和数据库表之间的双向数据流。通过在数据库中存储中间数据,您可以充分利用SQL的功能进行转换、分析和业务逻辑处理。这种统一的执行模型消除了iPaaS式应用程序集成和ETL式数据管道之间的传统界限。Sequor采用代码优先的方法(YAML用于流程,Jinja或Python用于动态参数,SQL用于逻辑),您可以将软件工程最佳实践应用于集成:版本控制、协作、CI/CD和本地开发。
阅读更多
vrs是一个雄心勃勃的个人软件运行时项目,旨在通过结合Emacs、Erlang、Unix等系统的优秀理念,提供一种充满乐趣且高效的编程体验。它使用一种名为Lyric的嵌入式Lisp方言,支持轻量级进程、消息传递和服务注册等特性,并可以运行数百万个进程而不会阻塞系统。开发者可以利用vrsctl命令行工具进行交互式编程和调试,以及emacs的lyric-mode插件进行高效开发。vrs目前仍在积极开发中,但其创新的并发模型和易于使用的Lisp方言使其极具潜力。
阅读更多
Microsandbox 是一款安全运行不受信任代码的工具,解决了传统方法(本地运行、容器、虚拟机、云端方案)的不足。它快速启动,支持多种编程语言(Python、JavaScript、Rust),并提供SDK和项目管理工具,方便开发者安全地运行AI生成的代码、用户提交的代码或实验性代码。其独特的微型虚拟机技术,确保了代码执行的隔离性,即使恶意代码也无法威胁系统安全。无论是开发环境搭建、数据分析,还是构建AI助手,Microsandbox 都能提供安全高效的解决方案。
阅读更多