Apache Cloudberry:开源MPP数据库,Greenplum的替代者

2024-12-21

Apache Cloudberry是一个先进成熟的开源MPP(大规模并行处理)数据库,由Greenplum数据库的原始开发者创建。它基于更新的PostgreSQL内核,拥有更强大的企业级功能,可用于数据仓库、大规模分析和AI/ML工作负载。Cloudberry提供多种构建和试用方式,包括从源代码构建和Docker沙箱,并拥有活跃的社区和丰富的文档支持,鼓励代码增强、错误修复、功能建议等多种贡献方式。

阅读更多
数据库 MPP Greenplum替代

BitNet: 微软开源的一比特大语言模型推理框架

2024-10-18

BitNet 是微软开源的一比特大语言模型推理框架,支持在CPU上进行快速和无损的1.58位模型推理,未来还将支持NPU和GPU。它在ARM CPU上实现了1.37倍到5.07倍的加速,在x86 CPU上实现了2.37倍到6.17倍的加速,同时显著降低了能耗。BitNet 还可以在单个CPU上运行100B的BitNet b1.58模型,速度可达每秒5-7个token。

阅读更多
29
未分类

Notion数据目录发展简史

2024-10-27

这篇文章回顾了Notion数据目录的发展历程,重点介绍了三个主要阶段:早期混乱、建立基础和增强用户参与度。Notion团队最初缺乏结构化的数据管理,导致数据一致性和治理问题。为解决这些问题,他们引入了数据目录工具,并建立了事件分级和所有权系统。为了进一步提高用户参与度,他们采用了TypeScript作为接口定义语言,并利用AI自动生成元数据描述,同时结合人工审核以确保准确性。

阅读更多
未分类

venvstacks:分层Python虚拟环境

2024-11-03

LM Studio开源了venvstacks,这是一个新的基于venv的Python项目,用于创建分层虚拟环境。它通过Python的sitecustomize.py功能将运行时、框架和应用程序三个层级的环境链接起来,方便共享依赖项,并支持锁定、构建和发布环境。该工具已在LM Studio中用于部署mlx-engine,无需用户安装Python依赖项,未来也将用于更多功能的部署和版本迁移。venvstacks已发布至PyPI,用户可通过pip安装使用。

阅读更多
未分类 venvstacks

GitHub - homebrewltd/ichigo: Llama3.1 学会倾听

2024-10-17

🍓 Ichigo(原llama3-s)是一个开源的实时语音AI研究项目,目标是扩展基于文本的LLM,使其具备原生“倾听”能力。它采用受Meta的Chameleon论文启发的早期融合技术,使用WhisperSpeechVQ对连续语音数据进行预训练,并通过在交织的合成数据上进行训练来增强模型的音频指令遵循能力。Ichigo v0.3模型在更清晰、改进的数据集上进行训练,实现了63.79的增强MMLU得分,并展现出更强的语音指令遵循能力,甚至在多轮交互中也是如此。

阅读更多
27
未分类 语音AI

Steam游戏商店页面将强制披露内核级反作弊软件信息

2024-10-31

Valve宣布Steam平台将强制要求游戏开发者在商店页面明确披露游戏中使用的内核级反作弊软件信息。此举是为了回应开发者和玩家对反作弊软件透明度的需求。该规定不仅适用于新游戏,也适用于已上线的游戏。Valve将进行检查以确保信息的准确性。虽然只强制要求披露内核级反作弊软件,但Valve建议所有使用反作弊技术的游戏都应告知玩家。

阅读更多
未分类

T-Mobile和AT&T反对手机解锁规定

2024-10-21

美国联邦通信委员会提议要求移动运营商在激活后60天内解锁手机,但遭到T-Mobile和AT&T的反对。这两家运营商声称,将手机锁定在运营商网络可以为消费者提供更便宜的手机,并有利于打击手机盗窃和欺诈行为。消费者权益组织则支持该提议,认为这将为用户提供更多选择并降低成本。

阅读更多
未分类

平台战略及其不满

2024-10-28

这篇文章分析了网络平台在移动端面临的严峻挑战。作者指出,尽管网络在桌面端占据主导地位,但在移动端,由于性能不佳、应用程序商店的限制以及浏览器厂商的消极态度,网页浏览体验远不如原生应用,导致用户使用时间和市场份额不断下降。作者呼吁开发者采取负责任的开发方式,减少JavaScript代码量,提升网页性能,并倡导打破平台封锁,为网络平台争取更广阔的发展空间。

阅读更多

我的NumPy年:为下一代科学计算创建DType

2024-10-24

这篇文章回顾了 NumPy 2.0 中引入新的字符串 DType 的开发历程。作者详细介绍了 NumPy 字符串数组在 Python 2 和 Python 3 中存在的问题,以及为什么需要新的字符串 DType。文章重点介绍了新 DType 的设计决策、克服的技术挑战以及从中学到的经验教训,包括如何使用 CPython C API、如何参与开源社区以及如何克服心理障碍。

阅读更多
未分类 DType

聚变能源真的近了

2024-11-23

2025年,聚变能源领域将发生两件大事,标志着数十年来对廉价、丰富的核聚变能源的探索将从公共部门转向私营部门。首先,一家私有公司将在2025年底启用名为SPARC的装置,这将是第一个接近商业规模的聚变反应堆,最终输出功率约为140兆瓦。其次,原定于2025年准备就绪的政府间聚变合作旗舰项目ITER将推迟启用。

阅读更多

Alloy Automation招聘软件工程经理

2024-11-23

Alloy Automation (YC W20) 正在招聘软件工程经理,负责构建和管理SaaS集成平台的核心产品功能。该职位要求10年以上软件工程经验,精通Node、React、TypeScript、JavaScript、AWS、MongoDB、Docker和Kubernetes等技术,并具备团队领导经验。工作内容包括领导前后端和全栈工程师团队,制定技术方向,解决复杂问题,与产品、QA和销售团队合作,以及参与代码审查等。

阅读更多

人格盆地

2024-11-21

本文提出了“人格盆地”的概念,用以解释人格的形成和发展。人格盆地类似于机器学习中的损失地形,其中较低的点代表更成功的人格。人生就是一个不断与环境互动、调整自身的过程,最终形成稳定的人格盆地。文章指出,人格变化大多是无意识的,受环境和社会因素的影响。文章还探讨了人格捕获的概念,即环境如何塑造个体的人格以使其符合周围环境的需求,例如社交媒体对用户注意力的争夺。最后,文章讨论了如何改变人格盆地,包括改变环境、提高学习率,以及一些高强度体验(如冥想、药物使用、创伤等)的影响。

阅读更多
8
未分类 人格

小行星之旅

2024-11-08

你是一位在浩劫中失去一切的侠士,在酒吧买醉时听到一个传说:古代外星人带着诅咒宝珠回来了,宝珠吸走了银河系所有美好事物。一位老人在一张餐巾纸上画了一张太空地图,指引你找到宝珠,恢复银河系的和平。你根据地图的指引坠落在小行星上,并在小行星内部开始冒险。

阅读更多
未分类 宝珠

Python 3.12 vs Python 3.13 性能测试

2024-10-21

本文对比测试了Python 3.13和Python 3.12的性能。测试涵盖100项基准测试,分别在搭载AMD Ryzen 7000系列和第13代英特尔酷睿处理器的台式机、笔记本电脑和迷你PC上进行。结果表明,Python 3.13在某些测试中表现出更优的性能,尤其是在异步IO和数学运算方面,但在其他测试中性能略有下降,例如代码覆盖率和正则表达式。

阅读更多
未分类

蘑菇颜色图谱

2024-11-08

该网站提供一个动态的蘑菇颜色图谱,用户可以根据蘑菇种类、染料或色素以及使用的织物和媒染剂来筛选颜色。图谱中的所有染料蘑菇都可在索引中搜索。网站还提供关于蘑菇染色方法、技术和变量的流程信息、相关资源和活动信息以及书籍推荐,旨在引导用户探索真菌王国的色彩世界。

阅读更多
未分类 染料

.NET 9.0 LINQ 性能改进

2024-10-18

文章介绍了.NET 9.0 中 LINQ 性能改进。其中主要包括使用 TryGetSpan() 方法对数组和列表进行快速迭代、针对常见 LINQ 调用链设计的特殊迭代器以及使用 SIMD 和空序列早期检测等优化。文章通过基准测试和代码示例详细介绍了这些改进带来的性能提升,并鼓励开发者升级到 .NET 9.0 以利用这些改进。

阅读更多
未分类 LINQ

一知半解rm -rf命令惹大祸

2024-11-18

文章讲述了一个名叫Miles的大学生,对Unix系统一知半解,过于自信地使用`rm -rf ~*`命令试图清理Emacs备份文件,结果意外删除了所有用户的主目录。由于系统管理员疏忽,Miles获得了过高的权限。最终,管理员恢复了文件,修改了权限,Miles也得到了教训,并成为了一名AS/400系统管理员。

阅读更多
未分类 rm -rf

为Damas-Hindley-Milner类型系统添加行多态

2024-10-23

本文介绍了如何在Damas-Hindley-Milner(HM)类型系统中添加行多态。文章首先解释了记录和行的概念,以及如何在类型系统中表示它们。然后,文章详细讨论了如何推断记录字面量的类型,以及如何在模式匹配中处理记录。最后,文章解释了行统一的概念,以及如何使用let多态实现行多态。

阅读更多
未分类 行多态

真的需要Redis吗?如何仅使用PostgreSQL就能实现

2024-11-04

本文探讨了如何利用PostgreSQL替代Redis在其最常见的Web服务和应用支持架构中的作用。文章指出,PostgreSQL 9.5版本以后提供的SKIP LOCKED选项可以实现类似Redis的作业队列功能,避免多个后台worker处理同一任务。此外,PostgreSQL的advisory locks可以实现分布式锁功能,而LISTEN和NOTIFY语句则可以实现类似Redis的Pub/Sub功能,用于客户端事件推送。文章承认Redis在缓存和处理临时数据方面仍有优势,但对于许多应用场景,PostgreSQL足以胜任,从而简化架构并降低运营成本。

阅读更多
未分类

Wazuh:开源XDR和SIEM安全平台

2024-10-30

Wazuh是一个开源的XDR和SIEM安全平台,为终端和云工作负载提供统一的保护。它集成了端点安全、云安全、威胁检测、事件响应和合规性管理等功能。Wazuh提供实时关联和上下文分析,并支持主动响应和设备修复。它具有灵活、可扩展、无供应商锁定和免费社区支持等优势,被广泛应用于各种企业环境。

阅读更多
19
未分类 XDR SIEM

SPANN:高效的十亿级近似最近邻搜索

2024-11-03

SPANN是一个高效的内存-磁盘混合近似最近邻搜索系统,它采用倒排索引方法,将posting lists的中心点存储在内存中,而将大型posting lists存储在磁盘中。SPANN通过减少磁盘访问次数和检索高质量的posting lists来保证磁盘访问效率和高召回率。在索引构建阶段,它采用分层平衡聚类算法来平衡posting lists的长度,并通过添加相应聚类中点的闭包来扩充posting lists。在搜索阶段,它使用query-aware方案动态修剪不必要的posting lists的访问。实验结果表明,SPANN比当前最先进的ANNS解决方案DiskANN快2倍,在三个十亿级数据集上达到相同的召回率90%,内存成本相同。

阅读更多
18

我对“全部标记为已读”按钮的赞赏

2024-11-17

作者高度赞扬了RSS阅读器中的“全部标记为已读”按钮。相比充斥垃圾信息的社交媒体,RSS让用户自主控制内容同步和阅读,避免了信息过载和算法的干扰。作者认为RSS的这种设计理念,回归了内容本身,提供了纯粹的阅读体验,是现代社交媒体的解毒剂。

阅读更多
未分类

你绝对应该读的最佳科幻小说

2024-10-28

本文推荐了一系列最佳科幻小说,并分别介绍了每本书的亮点和故事情节。作者从个人喜好出发,推荐了包括《拯救计划》、《X飞行员》、《生命工程》、《23号灯塔》、《不老》等作品,并穿插介绍了自己创作的小说《崛起》。这些推荐的作品涵盖了太空冒险、时间旅行、人工智能、未来世界等科幻主题,适合科幻爱好者阅读。

阅读更多
未分类 未来世界

GitHub - destel/rill: 用于简洁、可组合、基于通道的并发 Go 工具包

2024-11-25

Rill 是一个 Go 工具包,它为 Go 带来了可组合的并发性,使构建由简单、可重用部分组成的并发程序更容易。它减少了样板代码,同时保留了 Go 自然的基于通道的模型。Rill 的目标是使常见任务更容易,使并发代码可组合且简洁,集中错误处理,简化流处理,提供高级任务的解决方案,支持自定义扩展,并保持轻量级。它提供了一系列功能,包括批量处理、有序扇入、映射归约、流拆分、合并等。Rill 使用标准的 Go 通道,可以轻松地编写与库兼容的自定义函数。

阅读更多
未分类

我的电力来自哪座发电厂?

2024-11-24

本文探讨了电力供应的复杂性,从2000年加州能源危机引出电力市场机制。文章解释了电力公司如何通过电力市场进行电力交易,以及电力批发市场、实时市场和容量市场的运作方式。文章还分析了输电和配电成本,以及零售电力供应商的角色,并鼓励读者了解电费账单背后的含义。

阅读更多
未分类 电力市场

Fedora KDE桌面版与GNOME版地位平等

2024-11-08

Fedora KDE桌面版将升级为与GNOME版同等级的“Edition”版本。Fedora委员会已批准此项更改,这意味着从Fedora 42开始,KDE Plasma桌面版将与GNOME版在Fedora网站和活动中获得同等推广和支持。过去KDE在Fedora上的维护较差,但近年来Fedora KDE SIG的努力已显著提升其质量,使其与GNOME版体验相当。

阅读更多
未分类

柏林程序员:文化篇

2024-11-05

本文介绍了美国程序员在柏林生活感受到的文化差异,涵盖政治、欧盟、犯罪、生活方式、顾客服务、人际交往等方面。文章指出,德国政治氛围比美国更左倾,全民医保得到普遍接受,枪支管制严格,社会福利优厚。欧盟类似于一个弱联邦框架下的州联盟,但欧洲人对欧盟的认同感低于美国人对美国的认同感。柏林的生活普遍安全,但要注意适应公制系统和习惯当地人的顾客服务方式。文章还详细介绍了在德国的实用信息,如洗衣、使用电器、天气、避免“外国人圈子”、小费、WhatsApp、周日购物、吸烟、消费者权益网站、写信和打印、订阅服务、约会文化、以及遵守规则的重要性等。

阅读更多
未分类 德国生活

17世纪,脏话的分水岭

2024-11-01

17世纪是脏话发展史上的一个转折点。此前,最严重的脏话多与神圣事物相关,例如“上帝之血”“上帝之躯”。而到了18世纪,脏话则更多地与身体机能有关,例如排泄物或性器官。16世纪是一个过渡时期,一些如今被视为粗俗的词语,例如“arse”(屁股)、“shit”(屎)、“fart”(放屁)等在当时只是普通的描述性词汇。而像“fuck”这样的词语在当时也开始出现,但其用法和含义与现代有所不同。文章指出,在16世纪,人们更在意的是行为不端的名声,而不是描述行为本身的词汇。

阅读更多
未分类 脏话
1 2 90 91 92 94 96 97 98 544 545