TokenDagger:OpenAI TikToken 的高性能替代方案

2025-06-30
TokenDagger:OpenAI TikToken 的高性能替代方案

TokenDagger 是 OpenAI TikToken 的一个高性能替代品,针对大规模文本处理进行了优化。基准测试显示,在代码标记化方面,TokenDagger 的速度是 TikToken 的 4 倍以上,整体吞吐量提升 2 倍。该项目基于优化的 PCRE2 正则表达式引擎,并简化了字节对编码 (BPE) 算法,从而减少了大型特殊标记词汇表对性能的影响。开发者只需简单的几行命令即可安装和运行 TokenDagger,并进行性能测试。

阅读更多

亚马逊全球审查:书籍成重灾区

2025-03-27
亚马逊全球审查:书籍成重灾区

一份最新报告揭露亚马逊在其美国网站上对特定产品进行的地区性发货限制。研究人员发现,亚马逊限制向至少一个地区发货的产品多达17050种,其中书籍占比最高,且主要涉及LGBTQ+、神秘学、色情、基督教和健康等主题,受影响地区多为中东国家以及部分非洲国家。亚马逊使用误导性信息掩盖审查机制,违反了其公开承诺的人权原则。报告建议亚马逊改进其审查系统,提高透明度。

阅读更多
科技

HTML <dialog> 元素的 CSS 小技巧

2025-01-14
HTML <dialog> 元素的 CSS 小技巧

最近在玩HTML的``元素,它可以方便地创建原生对话框,无需大量JavaScript代码。文章介绍了两个实用技巧:一是使用`backdrop-filter: blur(2px);`为``的背景添加模糊效果;二是使用`body:has(dialog[open]) { overflow: hidden; }`在``打开时禁用页面滚动,避免页面内容在滚动时与对话框重叠。这两个技巧能提升用户体验,使对话框更易用。

阅读更多
开发 <dialog>

6502汇编:学习汇编的最佳起点?

2025-02-06
6502汇编:学习汇编的最佳起点?

学习汇编语言的最佳起点是什么?作者认为是6502。尽管6502在现代应用中并不常见,但其简单的指令集(只有56条指令)和丰富的学习资源使其成为学习汇编语言基本概念的理想选择。6502曾广泛应用于经典电脑,例如Apple II和Commodore 64,因此拥有大量的模拟器和学习资料。作者推荐了Easy 6502和Visual6502.org作为学习资源,并比较了其他架构如x86-64和ARM的复杂性,进一步强调了6502的优势。

阅读更多
开发

2025 年独立游戏开发:告别大型引擎,拥抱轻量级工具链

2025-05-20
2025 年独立游戏开发:告别大型引擎,拥抱轻量级工具链

一位拥有 20 年游戏开发经验的开发者分享了他 2025 年的独立游戏开发流程。他放弃了 Unity 和 Unreal 等大型引擎,转而使用 C#、SDL3、FMOD 和 Dear ImGui 等轻量级工具和库,构建了自己的小型工具链。他认为这种方式更灵活、更有趣,也更能掌控开发过程。文章详细介绍了他的技术栈选择、资产管理、关卡编辑器以及跨平台移植等方面的心得,并鼓励开发者根据自身情况选择合适的开发方式。

阅读更多
游戏

ErisForge:轻松修改大型语言模型

2025-01-27
ErisForge:轻松修改大型语言模型

ErisForge是一个Python库,允许用户通过变换大型语言模型(LLM)的内部层来修改其行为。它能够创建经过消融或增强的LLM版本,对特定输入产生不同的响应。ErisForge支持自定义行为方向,并提供工具来衡量模型响应中的拒绝表达。该库易于使用,并提供了详细的示例和文档。

阅读更多
开发 模型修改

在本地部署 671B 参数的 DeepSeek R1 模型

2025-01-31

本文介绍了使用 Ollama 在本地部署 671B 参数的 DeepSeek R1 大型语言模型的经验。作者尝试了两种量化版本:1.73 位和 4 位,分别需要至少 200GB 和 500GB 的内存。在拥有四块 RTX 4090 和 384GB DDR5 内存的工作站上,测试结果显示 1.73 位版本生成速度略快,但 4 位版本更稳定,且更不容易生成不当内容。作者建议将模型用于较轻量级的任务,避免长文本生成导致速度显著下降。部署过程需要下载模型文件、安装 Ollama、创建模型文件并运行模型,过程中可能需要调整 GPU 和上下文窗口大小参数以避免内存溢出。

阅读更多
开发

“安静辞职”现象背后的真相:员工对公平与界限的需求

2025-01-26
“安静辞职”现象背后的真相:员工对公平与界限的需求

近期“安静辞职”和“软辞职”引发热议。文章指出,这并非员工偷懒,而是对工作中不公平薪酬、过重工作量以及缺乏工作与生活平衡的合理回应。许多员工并非不关心工作,而是希望工作与个人福祉、职业发展相协调。文章呼吁企业关注员工诉求,通过公平的薪酬体系、灵活的工作安排和更有意义的工作内容来提升员工敬业度,避免因员工离职而造成的巨大经济损失。最终,文章建议企业培养好奇文化,鼓励员工参与,共同创造更有效率的工作环境。

阅读更多
创业 安静辞职

DISA数据泄露:330万员工信息被盗

2025-02-25
DISA数据泄露:330万员工信息被盗

美国员工背景调查公司DISA Global Solutions遭遇重大数据泄露事件,超过330万人的信息被盗,其中包括社会安全号码、金融账户信息和政府颁发的身份证件。黑客于2024年2月9日入侵DISA网络,直到4月22日才被发现。DISA表示,无法确定被盗数据的具体内容,这引发了人们对其安全措施的质疑。此次事件影响了55000多家企业和三分之一的《财富》500强公司,凸显了企业数据安全的重要性。

阅读更多
科技

构建可靠的RAG系统评估框架

2025-02-14
构建可靠的RAG系统评估框架

Qodo公司构建了一个基于检索增强生成(RAG)的AI代码助手,并开发了一个强大的评估框架来确保其准确性和全面性。评估面临的挑战包括验证基于大型私有数据集的RAG输出的正确性。该框架评估最终检索到的文档和最终生成的输出,关注“答案正确性”和“检索准确性”两个方面。为了应对自然语言输出的挑战,他们采用了“LLM作为评判者”的方法,并构建了一个包含真实问题、答案和上下文的ground truth数据集。为了提高效率,他们利用LLM辅助构建数据集,并使用LLM和RAGAS来评估答案的正确性。最终,他们构建了自己的LLM评判者,并将其与RAGAS结合使用,以提高评估的可靠性,并将其集成到工作流程中,实现了回归测试,显著降低了验证代码更改是否导致质量问题的难度。

阅读更多
开发

深入浅出Python异步编程:async/await背后的秘密

2025-05-09

本文深入探讨了Python异步编程模型async/await的底层机制。作者从并发和并行的概念出发,逐步讲解了如何构建一个高并发TCP服务器,比较了使用线程池和I/O多路复用等方法的优缺点。文章的核心在于解释async/await是如何基于生成器、协程以及yield/yield from等机制实现的,并详细分析了生成器和协程的底层实现细节,最后对比了asyncio和其他异步编程库的差异。

阅读更多
开发

速食软件 vs. 家常软件:一场关于软件开发哲学的辩论

2025-01-17

本文探讨了两种截然不同的软件开发方式:速食软件和家常软件。速食软件采用敏捷开发,快速迭代,以牺牲长期可维护性为代价换取快速上线。家常软件则注重前期设计,代码精简,更注重长期稳定性,但开发周期较长。作者以辛辣的笔触批判了当今盛行的速食软件开发模式,认为其导致了大量技术债务和糟糕的用户体验,并呼吁业界回归更注重质量和可维护性的家常软件开发模式。

阅读更多
开发

GitHub - skuep/AIOC: 业余无线电一体线

2024-12-12
GitHub - skuep/AIOC: 业余无线电一体线

AIOC 是一款带 USB-C 接口的小型适配器,可枚举为声卡(例如用于 APRS)、用于编程和断言 PTT(按下通话)的虚拟 tty(“COM 端口”)以及用于 CM108 样式 PTT 的 CM108 兼容 HID 端点(固件版本 1.2.0 中的新功能)。它基于易于破解的 STM32F302,带有内部 ADC/DAC,可通过 USB 引导加载程序使用 DFU 进行编程。它支持双 PTT HT,并与所有流行的操作系统(Linux、Windows 和 MacOS,但有一些限制)兼容。文章提供了关于制造、组装、构建、编程和使用 AIOC 的详细说明,以及 Direwolf、APRSdroid、CHIRP 和 VaraFM 等软件的兼容性说明。还讨论了已知问题和未来工作。

阅读更多
未分类 AIOC STM32F302

告别邮件过滤器:我的极简收件箱策略

2025-01-18
告别邮件过滤器:我的极简收件箱策略

作者尝试了Gmail和Apple Mail的标签和文件夹功能,以及ProtonMail的邮件规则,但最终发现这些功能增加了管理邮件的认知负担,导致错过重要信息。于是他删除了所有邮件过滤器,只保留一个收件箱。通过积极取消订阅、屏蔽发件人以及利用搜索功能,他实现了高效的邮件管理,并能快速判断邮件重要性。

阅读更多
杂项 邮件管理

秘鲁卡拉尔遗址发现3000年前金字塔和巨型地画

2025-02-04
秘鲁卡拉尔遗址发现3000年前金字塔和巨型地画

秘鲁文化部宣布在卡拉尔考古遗址发现一座金字塔和一个巨型地画。这座隐藏在茂密植被下的金字塔至少有三层平台,其垂直巨石和中央楼梯是卡拉尔建筑的典型特征。同时发现的巨型地画描绘了一个人物头像,其风格与北部塞钦文化相似,表明卡拉尔与其他安第斯文明之间存在早期文化交流。这一发现不仅丰富了对卡拉尔城市规划的理解,也为其旅游业发展提供了新的潜力,进一步展现了美洲最古老文明的复杂性和非战争发展的社会组织结构。

阅读更多
科技 秘鲁 卡拉尔

生成式AI大幅提升工作效率:每周节省数小时

2025-02-28
生成式AI大幅提升工作效率:每周节省数小时

圣路易斯联邦储备银行、范德比尔特大学和哈佛大学的一项研究发现,生成式人工智能帮助员工节省了大量工作时间。研究表明,使用生成式AI的员工每小时平均效率提高33%。高频用户节省时间更多,表明存在学习曲线。信息服务业员工节省时间最多,而休闲服务业员工节省时间最少。尽管AI的广泛应用尚属近期现象,其对整体生产力增长的最终影响仍存在不确定性,部分员工可能将节省的时间用于休息而非提高生产效率。

阅读更多
AI

SUS HDL:一种更易于理解的硬件描述语言

2025-07-07

SUS HDL 是一种新型硬件描述语言 (HDL),它致力于简化硬件设计流程。不同于 Verilog 或 VHDL,SUS 拥有延迟计数功能,方便开发者处理时序和流水线;其编译器会跟踪硬件设计的各个方面,并在编辑器中显示,方便调试;并支持强大的元编程功能,可以生成查找表 (LUT)。SUS 的核心设计理念是保持简洁的语法,方便开发者直接构建网表,并能与传统综合工具兼容。虽然它要求硬件同步,但其易用性和强大的功能使其成为一个有潜力的替代方案。

阅读更多
开发 SUS

告别文件混乱:Johnny.Decimal 文件管理系统

2025-02-21
告别文件混乱:Johnny.Decimal 文件管理系统

Johnny.Decimal 是一款帮你快速、自信、低压力地查找文件的系统。它通过为生活中的每一件物品分配唯一ID,并建立索引将它们联系起来,从而实现高效的组织管理。该系统类似于一个十层架子,每层代表一个生活领域(如家庭、工作),每层架子上有十个盒子,每个盒子代表一个类别,每个盒子里面装有编号的文件。这种基于数字的层级结构,避免了传统文件系统中文件夹名称随意性带来的混乱,使查找文件变得快速而高效。

阅读更多
开发 组织系统

地铁扑克:通勤路上的另类游戏

2025-02-19

在拥挤的地铁上,一款名为“地铁扑克”的新游戏悄然兴起。它将扑克的刺激与地铁的不可预测性巧妙结合,为你的日常通勤增添乐趣。游戏规则简单:你和同伴各选一排五个座位,根据乘客的类型(小孩为10,青少年为J,女人为Q,男人为K,老人为A)组成扑克牌型,到达约定车站后比牌决定胜负。策略在于观察乘客上下车情况,选择有利位置,并根据时间、天气等因素预测乘客类型。这款游戏风靡全球各大城市,但你可能需要根据当地地铁布局调整策略。

阅读更多
游戏

韩国民主:深夜政变危机与全民反击

2025-01-24
韩国民主:深夜政变危机与全民反击

韩国总统尹锡悦试图在深夜宣布戒严,引发全国震惊。然而,韩国强大的公民社会和政治家们迅速动员起来,通过立法手段挫败了这一政变企图。这展现了韩国民主韧性,其根源在于几十年来对抗独裁统治的经验,以及先进的数字连接和强烈的公民责任感。尽管存在政治极化等问题,韩国民主制度经受住了考验,但未来仍面临挑战。

阅读更多

Comet:便携式硬件设计,远程KVM利器

2025-03-16
Comet:便携式硬件设计,远程KVM利器

Comet是一款小巧而强大的远程KVM产品,提供2K分辨率@60FPS的流畅清晰视频输出。它搭载1.5GHz四核处理器,千兆以太网接口保证高速网络连接,USB 2.0接口支持外接设备(如指拨开关)。此外,它还支持Type-C电源供电、HDMI-IN视频输入和USB设备端口(用于连接鼠标),是远程设备管理的灵活高效解决方案。兼容各种设备,包括迷你电脑、台式机、笔记本电脑、服务器、工业电脑和电视盒等。

阅读更多

从Python工具到网页应用:三天血泪史

2025-02-09
从Python工具到网页应用:三天血泪史

作者花了三天时间,尝试将一个简单的Python工具转换为网页应用,最初尝试使用Flask和Bottle框架,但最终因为CORS问题和异步请求的复杂性而放弃。作者尝试使用JavaScript的Fetch API和Node.js搭建REST API,但发现维护成本过高,最终回到最初的Bottle应用,虽然用户需要等待请求完成,但代码简洁易维护。这个故事说明了技术选型的重要性,有时简单的方案才是最佳方案。

阅读更多
开发

书信的消亡与不朽:一场关于文字与情感的世纪对话

2024-12-25
书信的消亡与不朽:一场关于文字与情感的世纪对话

辛西娅·奥齐克在《死信办公室的声音》中,以独特的视角探讨了书信的消亡与不朽。从拜伦与卡罗琳·兰姆的热情书信到她本人化名卡罗琳·兰姆写给哲学家摩根贝瑟的戏谑情书,奥齐克展现了书信的多重面貌:它既是浪漫的载体,也是文学创作的灵感源泉,更是个人情感的真实告白。她还追溯了书信在文学史上的重要地位,从《弗兰肯斯坦》到《傲慢与偏见》,众多经典作品都以书信为叙事结构。文章也探讨了书信在不同时代背景下的演变,从传统手写信到电子邮件再到社交媒体,书信的形式不断变化,但其承载的情感和价值却依然存在。最终,奥齐克以对书信的深情缅怀,寄托了对逝去情感与时代的追忆,以及对未来人际交流的思考。

阅读更多
杂项

定期重启服务器:预防胜于治疗

2024-12-13

一家大学的研究团队面临一个棘手的系统管理员问题:服务器运行时间过长,需要重启,但频繁重启会影响用户体验。他们通常避免重启,但这次因服务器长时间运行而不得不进行大规模重启。为了避免类似情况再次发生,他们决定制定一个年度重启计划,每年至少重启三次,以配合学校的教学时间表,从而在预防潜在问题与保证用户体验之间取得平衡。

阅读更多
开发 定期重启

NeXT遗产:OS X的幕后功臣

2024-12-22
NeXT遗产:OS X的幕后功臣

本文讲述了NeXT公司及其操作系统NeXTSTEP对苹果OS X和iOS系统深远的影响。NeXTSTEP基于UNIX,带来了保护内存、抢占式多任务和守护进程等关键特性,提升了系统稳定性和效率。它还引入了Objective-C编程语言和Cocoa框架,简化了软件开发,并催生了Interface Builder等强大的开发工具。此外,NeXTSTEP的Display PostScript技术为OS X的Quartz图形系统奠定了基础。这些技术至今仍是苹果设备的核心,体现了NeXT公司对现代计算机技术的巨大贡献。

阅读更多
开发 OS X NeXTSTEP

Salesforce开源时间序列智能库Merlion:一站式AI模型解决方案

2025-02-28
Salesforce开源时间序列智能库Merlion:一站式AI模型解决方案

Salesforce开源了Merlion,一个强大的Python库,用于时间序列智能。它提供了一个端到端的机器学习框架,涵盖数据加载、模型构建、结果后处理和性能评估等所有环节。Merlion支持多种时间序列学习任务,包括预测、异常检测和变化点检测,并提供易于使用的默认模型和AutoML功能,方便工程师和研究人员快速开发和基准测试模型。此外,它还支持可视化和分布式计算,是处理工业规模时间序列应用的理想工具。

阅读更多
AI

通用汽车叫停Android Auto和Apple CarPlay的售后改装套件

2025-03-24
通用汽车叫停Android Auto和Apple CarPlay的售后改装套件

通用汽车(GM)强制一家经销商停止销售一款针对Ultium平台电动汽车的售后改装套件,该套件可恢复Apple CarPlay和Android Auto手机镜像功能。此举源于GM在2023年12月取消Ultium电动汽车上的Apple CarPlay和Android Auto支持,并计划在其未来的车型中使用自家的车载信息娱乐系统。尽管WAMS公司声称该套件经过严格测试,但GM的这一举动引发业内批评,因为一项研究显示近一半购车者不愿购买缺乏Apple CarPlay或Android Auto功能的汽车。GM此举迫使经销商转向其内置信息娱乐系统,否则将面临市场压力。

阅读更多
科技 Apple CarPlay

德国的数字中坚企业:一条超越硅谷的创新之路

2025-02-24
德国的数字中坚企业:一条超越硅谷的创新之路

文章探讨了为什么德国难以复制硅谷模式,并提出“数字中坚企业”(Digital-Mittelstand)的概念。作者认为,德国文化注重工艺和质量,与硅谷的快速增长和高风险文化截然不同。文章指出,德国的中坚企业(Mittelstand)模式,专注于细分市场和高质量产品,具有很强的韧性。作者建议德国政府应扶持“数字中坚企业”,通过提供薪资补贴、简化法规、提高增值税免税额度和提供英语支持等措施,鼓励这种更符合德国文化和经济特点的创新模式,从而在数字经济时代保持竞争力。

阅读更多

轻松阅读瑞典语电子书

2025-03-07

Ereader Easy Swedish是一个免费的在线电子书阅读器,可以将任何epub格式的书籍转换成简易瑞典语版本。即使你的瑞典语水平有限,或者你喜欢的书没有瑞典语版本,你也可以轻松阅读。该项目是瑞典语自学项目的一部分,近期更新修复了书籍封面背景、增加了显示原文的功能,并解决了翻译跳过部分原文文本的问题。

阅读更多
1 2 1017 1018 1019 1021 1023 1024 1025 1084 1085