Apache Iceberg 的等值删除难题:RisingWave 的解决方案

2025-08-13
Apache Iceberg 的等值删除难题:RisingWave 的解决方案

Apache Iceberg 成为数据基础设施领域的热门话题,但实时数据流入存在挑战。主流系统不支持直接将变更数据捕获(CDC)写入 Iceberg。文章深入探讨了 Iceberg 中的两种删除机制:位置删除和等值删除。等值删除适合流式 CDC,但会影响查询性能,许多主流引擎不支持。RisingWave 通过混合删除策略(批量更新使用位置删除,其他使用等值删除)和可调度压缩解决了此问题,实现了端到端的流式 CDC 到 Iceberg 的方案,并成功应用于 Siemens 等企业,显著提升了数据可用性。

阅读更多
开发

开源基准测试软件之父:Michael Larabel和Phoronix

2025-05-07

Michael Larabel是Phoronix.com网站的首席作者,于2004年创立了该网站,专注于提升Linux硬件体验。他撰写了超过20000篇文章,涵盖Linux硬件支持、性能、显卡驱动程序等主题。Larabel还是Phoronix Test Suite、Phoromatic和OpenBenchmarking.org等自动化基准测试软件的首席开发者。他的成就为开源社区做出了巨大贡献,极大地推动了Linux在硬件领域的应用和发展。

阅读更多
开发

Rust内核BlueOS:轻量级、安全且通用

2025-07-27
Rust内核BlueOS:轻量级、安全且通用

BlueOS是一个用Rust编写的轻量级、安全且通用的操作系统内核,兼容POSIX接口并支持Rust标准库。它目前支持ARM32、ARM64、RISCV32和RISCV64架构,并支持相应的QEMU平台,硬件板支持正在开发中。BlueOS项目包含内核核心、标准库实现、示例应用和详细文档,为开发者提供了一个完整的学习和开发环境。

阅读更多
开发 BlueOS

OpenAI的Stargate数据中心项目因关税和市场波动而延误

2025-05-13
OpenAI的Stargate数据中心项目因关税和市场波动而延误

OpenAI雄心勃勃的Stargate数据中心项目因关税导致的经济不确定性和市场波动而面临延误。市场波动和更便宜的AI服务使得银行、私募股权投资者和资产管理公司对Stargate项目持谨慎态度。该项目旨在为美国和海外的AI基础设施筹集高达5亿美元资金。软银曾表示将为此项目提供大量资金,但尚未制定融资方案或与潜在投资者进行详细讨论。关税可能会大幅增加数据中心建设成本,服务器机架、冷却系统、芯片和其他组件的价格上涨可能导致整体建设成本平均上涨5%-15%。投资者也越来越担心产能过剩,微软和亚马逊等科技巨头已经调整了其数据中心战略,在某些情况下减少了建设项目。

阅读更多
科技 Stargate

一款优秀的练歌神器,但仍有提升空间

2025-03-23
一款优秀的练歌神器,但仍有提升空间

这款应用对于学习乐理和钢琴演奏非常棒,尤其适合想提高唱歌技巧的用户。通过学习,你可以掌握钢琴演奏技巧,从而更好地掌握音准。然而,其不足之处在于没有包含升降音的练习,而购买额外课程也无法得知具体内容。虽然练习模式允许练习降音,但缺乏课程中那种循序渐进的组织方式,并且键盘上也没有显示升降音标记。总的来说,这是一款优秀的应用,但缺少升降音的练习使其有所欠缺。

阅读更多
游戏 乐理

Internet-in-a-Box:让偏远地区也能享用优质教育资源

2025-04-27

Internet-in-a-Box是一个创新的项目,旨在为偏远地区提供高质量的教育资源。它可以从Kiwix、OER2Go和Archive.org等在线图书馆下载各种语言的内容包,包括学习视频、广播节目和教育应用程序。用户可以选择适合自己需求的资源,例如YouTube和Vimeo上的学习视频,以及近40款强大的教师和学生应用程序,甚至可以选择Kolibri、Moodle等完整的学习管理系统。该项目极大地提升了偏远地区获取教育资源的能力,弥合了数字鸿沟。

阅读更多
教育

150年前的3D战争影像:重现美国内战

2025-05-29
150年前的3D战争影像:重现美国内战

纽约历史学会数字化了700多张美国内战时期的立体照片,这些照片由布雷迪及其团队使用当时新兴的立体摄影技术拍摄。通过立体镜或现代技术(如手机和VR眼镜),我们可以身临其境地感受150年前的战场,看到林肯、谢尔曼等历史人物,以及战争带来的巨大破坏。这批珍贵的影像资料,为我们理解历史提供了全新的视角。

阅读更多

泰诺毒杀案:狡猾的逃亡与最终的落网

2025-06-03
泰诺毒杀案:狡猾的逃亡与最终的落网

1982年,震惊美国的泰诺毒杀案发生后,警方追捕凶手詹姆斯·刘易斯和莱安·刘易斯夫妇。这对夫妇化名潜逃,甚至在纽约公开阅读芝加哥报纸追踪案件进展,最终因在图书馆被认出而落网。调查显示,刘易斯有复杂的身世和犯罪前科,其作案动机与一起旧案有关,但是否与泰诺案直接相关仍存疑。妻子莱安的测谎结果显示其存在欺骗行为,进一步加深了案件的复杂性。

阅读更多

API Platform大会2025:AI赋能API开发的盛会

2025-07-09
API Platform大会2025:AI赋能API开发的盛会

API Platform大会将于2025年9月18日至19日在法国里尔和线上同步举行。此次为期两天的盛会将聚焦API Platform及其生态系统(包括PHP、Symfony、JavaScript、AI、FrankenPHP、性能和工具)的最新趋势、最佳实践和案例研究。大会将提供近30场英语和法语演讲,面向创新型公司、项目负责人和技术娴熟的开发人员。开发者、CTO和技术决策者不容错过!论文征集截止日期为3月23日,最终演讲嘉宾将于5月14日公布。

阅读更多
开发 API Platform

Android 16:个性化、Gemini集成和XR的未来

2025-07-14
Android 16:个性化、Gemini集成和XR的未来

Google Android生态系统总裁Sameer Samat详解Android 16的重大更新:Material 3 Expressive设计语言带来更强大的个性化定制,与三星合作实现新系统与旗舰手机同步发布,以及Gemini AI的深度集成,提供更智能的搜索和辅助功能。Samat还谈到Android XR的未来,强调AI将是其核心驱动力,并从Google Glass的经验中吸取教训,与时尚品牌合作,打造更时尚、更实用的AR眼镜。

阅读更多
科技

互联网档案库直播微缩胶卷数字化过程

2025-05-22
互联网档案库直播微缩胶卷数字化过程

互联网档案库(Internet Archive)开启了一个新的直播项目,向公众展示其“民主图书馆”(Democracy's Library)计划中微缩胶卷数字化工作的幕后场景。该项目旨在数字化和共享数百万份政府记录。直播视频展示了工作人员如何将易碎的微缩胶卷转化为可搜索的公共文档,整个过程包括高分辨率扫描、图像拼接和裁剪,以及OCR文本识别。直播时间为太平洋时间周一至周五上午7:30至下午3:30,节假日除外。

阅读更多

超高速内存 PostgreSQL 测试库 py-pglite:无需安装 PostgreSQL

2025-06-06
超高速内存 PostgreSQL 测试库 py-pglite:无需安装 PostgreSQL

py-pglite 是一个 Python 测试库,它在 PGlite 和 Python 测试套件之间实现了无缝集成。它允许你在测试中充分利用 PostgreSQL 的强大功能,而无需安装完整的 PostgreSQL。py-pglite 使用内存中的 PostgreSQL,测试运行速度极快;无需安装 PostgreSQL,只需 Node.js;原生支持 SQLAlchemy 和 SQLModel;每个测试模块拥有独立的数据库,确保测试隔离;完全兼容 PostgreSQL 功能;提供 pytest 插件,方便使用;支持自定义配置,例如超时时间、日志级别等;提供数据库清理工具,方便测试数据管理。

阅读更多
开发

数据擦除与翻新:揭秘二手电脑的重生之路

2025-05-26
数据擦除与翻新:揭秘二手电脑的重生之路

SK TES公司弗雷德里克斯堡工厂对报废电脑进行数据擦除、检测和翻新。员工会仔细检查电脑内部,寻找隐藏的驱动器,并根据功能、外观和组件价值进行评分。经过测试,具有零售价值的电脑会贴上全机身贴膜,掩盖瑕疵,最终进入零售市场。这一过程揭示了电子垃圾回收利用的可能性,也展现了技术修复的魅力。

阅读更多

AI全能机器人能否重振德国和日本经济?

2025-01-23

文章探讨了自1995年以来,德国和日本经济相对美国和中国的衰落。作者Jürgen Schmidhuber认为,人工智能驱动的全能机器人可能是扭转这一局面的关键。他回顾了他在慕尼黑工业大学的早期研究成果,包括LSTM和Transformer等关键AI技术的起源,并指出德国错失了AI发展机遇,这与该国对AI的投资不足以及人才流失有关。作者呼吁德国启动一项国家级项目,开发能够胜任人类不愿从事工作的全能机器人,这将有助于解决劳动力短缺问题,并促进经济复苏。

阅读更多
科技

UR5机械臂抓取与放置模拟:PyBullet环境下的自主操作

2025-08-06
UR5机械臂抓取与放置模拟:PyBullet环境下的自主操作

该项目在PyBullet环境中模拟了一个配备Robotiq 85夹爪的UR5机械臂,实现自主抓取和放置物体的任务。利用逆向运动学(IK)精确控制机械臂,并使用同步关节控制模拟逼真的夹爪动作,机械臂能够从随机位置抓取立方体并将其放置在托盘上。该模拟包含动态物体放置、实时交互等特性,为机器人抓取和放置任务提供了一个直观的模拟环境。

阅读更多

AI伪造案例引发的英国法律危机

2025-06-08
AI伪造案例引发的英国法律危机

英国法院近期曝光了两起律师使用AI生成虚假案例的事件,引发了对司法体系和公众信任的严重担忧。一起案件中,律师引用了18个并不存在的案例,另一案中律师也引用了5个虚假案例。法官警告,律师有义务核实信息的准确性,否则可能面临刑事指控,甚至面临最高终身监禁的“妨碍司法公正”罪名。尽管法官对涉事律师进行了监管机构处罚,但这起事件突显了AI在法律领域的风险与机遇并存的现实,也迫切需要制定相应的监管框架以维护司法公正。

阅读更多
法律

Android的以太网适配器之谜:一个愚蠢的正则表达式

2025-06-08
Android的以太网适配器之谜:一个愚蠢的正则表达式

本文讲述了作者尝试在Android手机上使用USB以太网适配器却失败的经历。深入调查后发现,问题并非驱动程序缺失,而是Android系统中的`EthernetTracker`服务使用了一个正则表达式`eth\d`来匹配以太网接口名称,而CDC以太网适配器创建的接口名称为`usbX`,导致无法识别。作者详细描述了排查问题的过程,包括获取内核配置、分析Android源码等,最终揭示了这个令人哭笑不得的根本原因:一个简单的正则表达式限制了功能。这篇文章既展现了作者强大的问题解决能力,也暴露了Android系统设计中可能存在的缺陷。

阅读更多
开发 USB以太网

快速构建软件的技巧:从粗略草稿到精益求精

2025-07-14

本文作者分享了多年软件开发经验,总结了快速构建高质量软件的技巧。他强调根据项目需求设定代码质量标准,建议采用“粗略草稿”方法,先快速构建一个功能性原型,再逐步完善。文中还提到要尝试简化需求,避免分心,并进行小的、集中的代码更改。此外,作者还分享了一些提升效率的技能,例如阅读代码、数据建模、脚本编写和使用调试器等,以及如何有效利用大型语言模型辅助开发。

阅读更多
开发

跨大西洋的1-2-3调试:零定律的实践

2025-03-31
跨大西洋的1-2-3调试:零定律的实践

1990年左右,作者通过传真远程调试客户的Lotus 1-2-3软件。由于跨大西洋电话费用高昂,传真成为最佳选择。作者通过逐步指导客户执行`/ppomr`和`/ppoml`命令,获取打印机页边距信息,最终解决了问题。这个故事强调了调试的“零定律”:使用最小、最快的测试用例,快速迭代,从而高效解决问题。

阅读更多
开发 远程调试

中国成功在塔克拉玛干沙漠周围建成绿色屏障

2024-12-08
中国成功在塔克拉玛干沙漠周围建成绿色屏障

经过46年的努力,中国成功在塔克拉玛干沙漠周围建成了1900英里的绿色屏障。该项目始于1978年,旨在对抗沙漠化,减少沙尘暴的影响。该项目结合了太阳能防沙技术和植树造林,并在新疆和田县完成了最后阶段的种植。绿色屏障的建成预计将保护基础设施,为当地社区创造经济机会,并促进可再生能源发展,为全球类似项目提供示范。

阅读更多
未分类 沙漠化防治

基于电路板应变传感器的微小形变测量

2025-05-11
基于电路板应变传感器的微小形变测量

这个项目展示了一种巧妙的应变传感器设计,其传感元件直接集成在电路板上。该传感器灵敏度极高,能够测量微米级的挠度,量程可达±3厘米。它采用4元件或2元件桥式电路,可通过手工组装完成,无需回流焊。用户可以选择使用集成的Seeed Studio XIAO RP2040微控制器或外部微控制器。此外,还提供了一个Python脚本用于数据可视化和一个Jupyter Notebook用于自定义传感元件形状。

阅读更多

AI工具的依赖性:舒适的陷阱?

2025-02-15
AI工具的依赖性:舒适的陷阱?

一项微软和卡内基梅隆大学的研究发现,过度依赖AI工具会削弱人类的批判性思维能力。研究人员调查了319名知识工作者,结果显示,对AI工具越依赖,批判性思维参与越少,独立解决问题的能力也随之减弱。虽然AI能提高效率,但过度依赖会使人丧失独立思考的习惯,最终可能导致自身能力退化,这或许是AI时代一个意想不到的风险。

阅读更多
AI

Jwno:一款基于Janet的Windows窗口管理器

2025-05-20

Jwno是一款高度可定制的Windows 10/11窗口管理器,使用Janet语言开发。它引入了“魔法括号”功能,可以精细控制窗口布局。该项目目前仍在开发中,文档尚未完善,但已提供安装指南、交互式教程和参考索引等资源,并附带示例图片展示其在管理Emacs、Sonic Pi等程序时的效果。

阅读更多
开发

巴哈马域名乌龙:巴塞尔税务局的数字报税链接出错

2025-01-31
巴哈马域名乌龙:巴塞尔税务局的数字报税链接出错

巴塞尔城市州税务局因宣传册上的一个小错误,不得不购买了一个巴哈马的网址。宣传册上印有数字报税的网址,但缺少“.ch”后缀,导致网址指向了巴哈马。这个错误的网址已申请注册,注册完成后将重定向到正确的巴塞尔州网址。尽管如此,这个失误还是给税务局带来了大约900瑞郎的额外开支,而重新印刷宣传册则需要超过10万瑞郎。

阅读更多
杂项

arXivLabs:与社区协作的实验性项目

2025-05-23
arXivLabs:与社区协作的实验性项目

arXivLabs是一个允许协作者直接在arXiv网站上开发和共享新功能的框架。参与arXivLabs的个人和组织都认同并接受了arXiv关于开放性、社区、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与遵守这些价值观的合作伙伴合作。如果您有想法可以为arXiv社区增值,请了解更多关于arXivLabs的信息。

阅读更多
开发

Chromium包含图可视化:一个150MB的GraphML文件

2025-05-21
Chromium包含图可视化:一个150MB的GraphML文件

本文作者使用其clang-include-graph工具,可视化了Chromium项目的包含图。这需要构建Chromium以生成compile_commands.json文件,然后使用clang-include-graph生成GraphML文件。生成的GraphML文件大小达150MB,包含14万个节点和130万条边。作者使用Gephi软件进行可视化,并通过Python脚本进行数据分析,展示了Chromium代码库的包含关系,以及一些有趣的统计数据,例如最大的强连通分量包含92个节点,却贡献了99%的循环。

阅读更多
开发

AI蜂箱:拯救蜜蜂,重振农业

2025-07-01
AI蜂箱:拯救蜜蜂,重振农业

美国蜜蜂数量锐减,严重威胁农业生产。Beewise公司研发的AI智能蜂箱BeeHome,利用人工智能和机器人技术,实时监测蜂群健康状况,自动进行疾病治疗和环境调节,显著降低蜂群死亡率。BeeHome已在美国广泛应用,并获得了巨额投资,有望彻底改变养蜂业,保障全球粮食安全。

阅读更多
科技 蜜蜂保护

X平台禁止第三方使用其数据训练AI模型

2025-06-05
X平台禁止第三方使用其数据训练AI模型

马斯克旗下X平台更新开发者协议,禁止第三方使用其内容训练大型语言模型。此举源于xAI公司(马斯克的AI公司)今年三月收购X后,为防止竞争对手免费获取数据。此前,X曾允许第三方使用其公开数据训练AI模型,此番转变反映了其对数据保护和竞争策略的调整。这一举动也与Reddit和Dia浏览器等平台采取的类似措施相呼应,显示出科技公司对AI数据使用的谨慎态度日益增强。

阅读更多
1 2 758 759 760 762 764 765 766 1084 1085