阿里巴巴发布开源AI模型QwQ,挑战OpenAI的o1推理模型

2024-11-29

阿里巴巴发布了一款名为QwQ-32B-Preview的全新“推理”AI模型,可与OpenAI的o1模型相媲美,它包含325亿参数,可以处理长度约为32000个单词的提示,在某些基准测试中表现优于o1-preview和o1-mini。QwQ-32B-Preview能够解决逻辑难题和相当难的数学问题,但它也存在一些缺陷,例如可能会意外切换语言、陷入循环以及在需要“常识推理”的任务中表现不佳。与大多数AI不同,QwQ-32B-Preview和其他推理模型会进行事实核查,这有助于它们避免一些通常会困扰模型的陷阱,但缺点是它们通常需要更长的时间才能得出解决方案。QwQ-32B-Preview已在AI开发平台Hugging Face上发布,可供下载和运行,它在某些政治话题上较为谨慎。虽然QwQ-32B-Preview以Apache 2.0许可证“开源”提供,但只发布了部分组件,因此无法完全复制或深入了解其内部工作原理。

阅读更多
未分类 阿里巴巴

核心版权侵权索赔在The Intercept起诉OpenAI的案件中继续进行

2024-11-29

纽约一位联邦法官裁定,The Intercept针对OpenAI的核心版权侵权索赔将继续在法庭上进行。该裁决是继OpenAI试图驳回几家数字新闻出版商的诉讼后,本月涉及这家AI开发商的一系列重大法律裁决中的最新一起。法官Jed Rakoff表示,他将审理OpenAI在涉嫌将The Intercept的文章输入用于构建ChatGPT的训练数据集时删除作者信息的索赔。这样做可能违反了1998年的《数字千年版权法》(DMCA),该法案规定,从数字作品中删除作者姓名、使用条款或标题等信息是非法的。该法官驳回了The Intercept关于OpenAI在删除受DMCA保护的信息后故意分发其文章副本的索赔。他还驳回了The Intercept对微软的所有索赔,微软对OpenAI进行了数十亿美元的投资,并在最初的诉讼中被点名。法官的意见将在未来几周内公布,其中列出了他驳回索赔的理由。

阅读更多
未分类

Daring Fireball:收购 Pixelmator 可能并非为了与 Photoshop 和 Lightroom 直接竞争,而是为了对抗 Adobe Creative Cloud 套装

2024-11-29

本文讨论了苹果公司收购Pixelmator的潜在战略意义,并非在于直接挑战Photoshop和Lightroom,而是为了构建一个与Adobe Creative Cloud抗衡的创意软件套装。作者引用了9to5Mac关于Final Cut Pro和Logic Pro iPad版本的订阅定价策略,指出苹果最终可能会将旗下创意软件打包成类似Adobe Creative Cloud的订阅服务,Pixelmator和Photomator的加入将填补苹果在图像编辑领域的空白,从而增强其套装的竞争力。

阅读更多
未分类

波兰发现二战德国士兵墓葬,陪葬品包括中石器时代工具、罗马和拜占庭硬币等

2024-11-29

在波兰北部的图霍拉森林,考古学家发现了一座二战德国士兵的坟墓。墓中除了士兵遗骸外,还出土了中石器时代的石器、新石器时代的陶器碎片、罗马帝国和拜占庭帝国时期的硬币以及近代的各种钱币。考古学家推测,这些硬币可能属于这名士兵,他或许是一位钱币收藏爱好者。这些发现跨越了数千年历史,展现了该地区丰富的历史文化。

阅读更多
未分类

不要乱搞滚动效果:为什么惯性滚动插件弊大于利

2024-11-29

文章强烈反对使用惯性(平滑)滚动插件,认为它弊大于利。作者列举了十个理由,包括违反用户预期、导致晕动症、降低无障碍性、设备性能不一致、影响高级用户的使用效率、增加页面加载时间、破坏原生浏览器功能、使滚动位置不明确、增加维护开销以及不尊重用户控制。作者认为这些插件增加了不必要的复杂性,降低了可用性,并使用户感到沮丧。文章主张坚持原生、可预测、快速的滚动行为,并尊重用户的选择。

阅读更多
未分类 滚动插件

用Sum和Product进行数据建模

2024-11-29

本文探讨了数据建模中的两个基本工具:Sum和Product,它们分别对应“或数据”和“与数据”。文章以医疗信息系统中的用药信息为例,讲解了如何使用Sum和Product进行数据建模,并用Java、Python、Haskell等多种编程语言进行了代码示例。此外,文章还讨论了Sum和Product在SQL和JSON等场景中的应用,以及它们与开闭原则的关系。

阅读更多
未分类 Sum和Product

芬兰和瑞典完成波罗的海海底电缆修复工作

2024-11-29

连接芬兰和德国的波罗的海海底电缆修复工作已完成,芬兰国有控股公司Cinia表示电缆已恢复正常运行。该电缆于11月18日凌晨发生故障,修复船于本周一展开修复。此外,连接瑞典和立陶宛的另一条海底电缆也于此前一天受损,并于周四晚间修复完成。两条电缆受损的原因尚在调查中,存在俄罗斯参与破坏的怀疑,但克里姆林宫坚决否认。芬兰、瑞典和立陶宛已成立联合调查组,中国也表示愿意配合调查。

阅读更多
(yle.fi)
7
未分类 波罗的海

机构记忆与反向走私

2024-11-29

文章讲述了一家大型石化公司在机构记忆流失后,如何重新找回关于一座老旧工厂的设计和运行文档的故事。由于公司重组、人员变动和文档管理混乱,工厂的原始设计文档几乎丢失殆尽。退休工程师被返聘,利用个人保存的文档和记忆,帮助公司重新理解工厂的运作方式。这就像一次“反向走私”,将公司遗忘的“秘密”重新带回。作者反思了机构记忆的重要性,以及文档管理和人员梯队建设对维护机构记忆的关键作用。

阅读更多
未分类 机构记忆

GIMP 3.0:开源图像编辑的里程碑

2024-11-29

GIMP 3.0 迎来了自 2018 年以来的首次重大更新,采用了 GTK 3 用户界面,带来了性能和可用性提升,并增强了与 Wayland 和复杂输入设备的兼容性。新版本支持 CSS 主题、多点触控和改进的色彩管理,并实现了非破坏性编辑,优化了图层工作流程和文件格式支持。此外,GIMP 3.0 还引入了新的扩展系统和文件格式 GEX,方便插件和主题的管理。

阅读更多
6
未分类

火箭的红色光芒

2024-11-29

本文以怀旧飙车为主题,讲述了作者Rachel Kushner与儿子Remy沉浸于美国怀旧飙车文化中的经历。他们参与了NHRA Nostalgia Nationals赛事,近距离观察了各种老式赛车、车手和技师,体验了硝基甲烷的威力和赛车文化中的激情与传承。文章探讨了怀旧飙车文化中的机械技艺、家庭传承、社群凝聚力以及对速度和机械的热爱,并将其与现代社会中日益盛行的被动消费模式和技术依赖进行了对比,突出了怀旧飙车文化中人与机械、人与人之间真实而深刻的联系。

阅读更多

“PDF 转脑腐”学习工具是TikTok趋势的奇异迭代

2024-11-29

一些基于人工智能的学习工具正在利用“PDF 转脑腐”的趋势。用户上传文档,工具会在播放“令人身心愉悦”的视频(如 ASMR 或游戏片段)的同时,朗读文档内容。TikTok 上这类视频非常流行,通常是单调的电脑合成音在朗读故事,配上重复的画面。很多工具如 Coconote、Study Fetch 等都推出了类似功能,甚至加入了 Gen Z 流行语的语音选项。然而,这种学习方式的有效性以及一些工具的营销策略受到质疑,部分推广视频疑似未公开的广告。虽然这种方式对某些学生可能有效,但其流行背后可能隐藏着对 AI 工具的变相宣传。

阅读更多

更优的身份验证:Better Auth

2024-11-29

Better Auth是一个全面的TypeScript身份验证框架,支持电子邮件、密码、社交登录、双因素身份验证和多租户等功能。它与流行的框架(如React、Vue、Svelte等)兼容,并拥有丰富的插件生态系统。许多开发者对Better Auth给予了高度评价,认为它使用简单、类型安全,并且极大地提升了身份验证体验。

阅读更多
未分类

Bananas:一款简易的跨平台屏幕共享工具

2024-11-29

Bananas 是一款适用于 Mac、Windows 和 Linux 的简易屏幕共享工具。它使用点对点连接来共享屏幕,无需帐户或任何服务器基础设施(初始连接信息交换所需的 stun、turn 和信令服务器除外)。用户可从 GitHub 发布页面下载最新版本。

阅读更多
未分类

加拿大竞争局起诉谷歌在线广告反竞争行为

2024-11-29

加拿大竞争局对谷歌提起诉讼,指控其在加拿大在线广告技术服务领域存在反竞争行为。调查发现,谷歌滥用其在网络广告领域的主导地位,强制市场参与者使用其广告技术工具,阻止竞争对手公平竞争,扭曲了竞争过程。竞争局认为,谷歌捆绑其各种广告技术工具,操纵广告资源访问,并以不利的条款对待竞争对手,损害了加拿大广告商、出版商和消费者的利益。竞争局已向竞争法庭申请命令,要求谷歌出售部分广告技术工具,支付罚款并禁止其继续反竞争行为。

阅读更多

稀疏自编码器用于大型语言模型可解释性的直观解释

2024-11-29

本文以直观的方式解释了稀疏自编码器(SAE)如何用于解释大型语言模型(LLM)。LLM 的可解释性面临挑战,因为神经元概念叠加,单个神经元对应多个概念。SAE 通过将模型的中间激活压缩成稀疏表示,将模型计算分解成可理解的组件。每个 SAE 特征由编码器和解码器向量组成,编码器检测模型的内部概念,解码器表示特征方向。通过观察激活特征的输入和进行因果干预,可以理解特征的含义。然而,SAE 评估仍面临挑战,主要依赖于主观解释和代理指标,例如 L0 和损失恢复。

阅读更多
未分类

使用Pandoc和Typst生成PDF文件

2024-11-29

本文介绍了如何使用Pandoc和Typst将Markdown格式的文本转换为美观的PDF文件。Typst是一款新的开源排版工具,Pandoc则是一个通用的文档转换器。文章提供了一个简单的教程和一个自定义模板,方便用户控制PDF的输出格式,如页面大小、页边距、字体、段落样式等。用户可以通过修改模板来满足个性化需求,并可参考Typst文档了解更多高级功能。

阅读更多
未分类 Pandoc

Spotify开发者平台Web API变更公告

2024-11-29

Spotify开发者平台宣布调整Web API,限制新应用访问部分接口和功能,包括相关艺术家推荐、音频功能、音频分析、精选歌单、分类歌单、30秒预览链接以及算法和Spotify自有编辑歌单。现有已扩展访问权限的应用不受影响。此举旨在增强平台安全性,并称会持续评估平台设置,以确保为开发者、艺术家、创作者和听众提供最佳体验。

阅读更多
未分类 开发者平台

MyPhotos.Site:一键生成精美谷歌相册网站

2024-11-29

MyPhotos.Site 提供快速简单的谷歌相册网站生成服务,无需编码或设计技能,只需三步即可创建并分享精美图库网站。用户可通过谷歌账户登录,选择要展示的照片,一键生成网站并获取分享链接或嵌入代码。该网站适用于摄影作品展示、生活分享、家庭照片分享等多种场景,并提供多种自定义选项。

阅读更多

笃信实践的思想家

2024-11-29

本文介绍了美国著名哲学家和心理学家威廉·詹姆斯的生平、思想及其影响。詹姆斯出身名门,却长期受困于神经衰弱,最终在工作和爱情中找到了方向。他著有心理学经典著作《心理学原理》,并推广了实用主义哲学,强调根据结果检验信念和决策。詹姆斯还将心理学应用于教育,倡导乐观主义和同理心。他对宗教信仰的辩护以及对战争的批判也产生了深远的影响。

阅读更多

Bootkitty:针对Linux系统的首个UEFI启动工具包分析

2024-11-29

ESET研究人员分析了第一个针对Linux系统设计的UEFI启动工具包Bootkitty。该启动工具包尚处于概念验证阶段,尚未在野外发现。它的主要目标是禁用内核的签名验证功能,并通过Linux init进程预加载两个ELF二进制文件。Bootkitty通过修改GRUB引导加载程序和Linux内核的EFI存根加载程序来实现此目的。研究人员还发现了一个可能相关的未签名内核模块BCDropper,它会部署一个负责加载另一个内核模块的ELF程序。尽管Bootkitty目前仅支持有限数量的系统,但它的存在凸显了UEFI启动工具包不再局限于Windows系统这一事实。

阅读更多
未分类 Bootkit

技术视角:魔镜魔镜告诉我,哪种拓扑结构最好?

2024-11-29

本文讨论了为大规模AI系统设计合适的网络拓扑结构。AI工作负载需要兼顾数据并行、流水线并行和算子并行,对网络带宽提出了特殊要求。传统高性能计算网络通常全局带宽过剩,而局部带宽不足。文章介绍了HammingMesh,一种结合了环面拓扑和交换拓扑优点的新型网络拓扑,它通过用交换机连接一组二维网格来形成不同大小的虚拟环面拓扑,既能提供高带宽,又能降低成本,并能灵活应对故障和不同的任务分配。文章还探讨了AI领域向稀疏模型发展的趋势,以及HammingMesh在未来AI系统中的潜力。

阅读更多
未分类 网络拓扑

GitHub - ilevd/cwp:基于缩进的 Clojure 语法

2024-11-29

cwp 项目为 Clojure 语言提供了一种基于缩进的 Python 风格语法。它简化了数学运算的编写,并使逗号和 to 关键字在大多数情况下可选。cwp 作为 Leiningen 插件和转译器,可以直接生成可读的 Clojure 代码,并保留了 Clojure 的特性,例如函数式编程、并发原语以及丰富的 Clojure/Java 生态系统。项目提供了数据操作、HTTP 服务器搭建以及 core 函数重写的示例,方便用户上手。

阅读更多
未分类 缩进

下一词预测中的物理学

2024-11-29

该研究发现了下一词预测(NTP)中的潜在物理规律,提出了信息容量第一定律(IC-1),指出自回归模型中智能涌现的本质是一个信息传递过程。同时,该研究将Landauer原理引入NTP,制定了信息容量第二定律(IC-2),建立了自回归模型训练与能量消耗之间的关系,并提出了一些对实际应用具有指导意义的推论。最后,该研究论证了信息容量定律与神经语言模型的缩放定律、知识容量缩放定律和精度缩放定律之间的一致性。

阅读更多
7
未分类 信息容量定律

美国反垄断监管机构对微软展开广泛调查

2024-11-29

美国联邦贸易委员会(FTC)已对微软展开反垄断调查,调查范围涵盖微软的云计算、软件许可业务、网络安全产品以及人工智能产品。FTC在与微软的竞争对手和商业伙伴进行了一年多的非正式访谈后,向微软发出了数百页的详细信息请求。调查重点关注微软将其办公软件和安全软件与云产品捆绑销售的做法,以及微软作为政府承包商的市场支配力。FTC认为,微软的网络安全漏洞及其作为政府承包商的地位,体现了该公司对市场的过度控制。此外,调查还涉及微软的身份验证软件Microsoft Entra ID,竞争对手抱怨微软的许可条款和捆绑销售策略阻碍了竞争。

阅读更多
未分类

铜寿司:基于区块链的虚拟电厂

2024-11-29

本文介绍了欧洲电网的可视化地图,其中绿色点代表电力输出,紫色点代表电力输入,三角形显示电力流向。该可视化基于pypsa-eur的研究数据,并使用优化算法模拟了欧洲电网的电力流动,旨在找到成本最低的电力生产方案。文章强调,虽然模型使用了真实的计算方法,但其基于的历史平均价格数据并非实时数据,因此结果并非完全真实。作者认为,通过将供暖和交通运输转换为电力,并确保以近零排放的方式发电,可以大幅减少发达国家的排放。此外,他还强调了智能地建设可再生能源的重要性,以确保所产生的能源能够被有效利用,而不是因为电网无法处理而被浪费。

阅读更多

Vince:自托管的 Google Analytics 替代方案

2024-11-29

Vince 是一个自托管的网站分析工具,可以替代 Google Analytics。它支持自动 TLS、事件跟踪、链接和文件下载跟踪、404 页面跟踪以及自定义事件跟踪等功能。Vince 以单一二进制文件发布,易于部署和操作,且不限制网站和事件数量。它注重隐私,不使用 Cookie,并符合 GDPR、CCPA 和 PECR 等法规。与 Plausible Analytics 相比,Vince 专注于自托管,不支持多租户和企业级功能,但提供无限站点和事件跟踪。

阅读更多
未分类

2024 年多模态可解释性

2024-11-29

本文探讨了 2024 年多模态可解释性的研究进展,重点关注基于电路的方法、文本-图像空间方法和描述方法。基于电路的方法包括手动和自动电路发现,以及利用稀疏自动编码器改进表征。文本-图像空间方法利用共享嵌入空间解释视觉模型,例如 TEXTSPAN 算法。描述方法通过描述激活神经元的图像来解释神经元功能。文章还讨论了将文本嵌入应用于非语言模型解释的策略,例如锁定图像调整和适配器。最后,强调了高质量数据、基准数据集和改进的自动解释方法的必要性。

阅读更多
未分类

Borgo 编程语言

2024-11-29

Borgo 是一种编译到 Go 的新编程语言。它具有类似 Rust 的语法和功能,包括代数数据类型、模式匹配、Result 和 Option 类型、以及对 Go 生态系统的互操作性。Borgo 支持指针、引用、方法和接口,并提供类似 Go 的并发原语(goroutines、通道和 select 语句)。Borgo 还引入了改进的错误处理和零值处理方式,避免了 nil 的使用,以增强代码的安全性。

阅读更多
未分类

TikTok首席执行官在Călin Georgescu意外赢得罗马尼亚总统大选首轮投票后被欧洲议会传唤

2024-11-29

在罗马尼亚总统大选首轮投票中,政治素人Călin Georgescu意外获胜,引发了罗马尼亚和欧洲的震动。欧洲议会自由派复兴欧洲集团负责人Valérie Hayer要求TikTok首席执行官到欧洲议会回答问题,以回应外界对TikTok在此次大选中所扮演角色的质疑,特别是关于虚假账户、政治宣传和潜在的外国干预等问题。Georgescu的竞选活动主要依靠TikTok,尽管缺乏传统资金和政党支持,却在几周内迅速蹿红。批评人士认为,TikTok的算法可能放大了有利于Georgescu的竞选内容,并对TikTok未能有效标记政治广告和打击虚假信息表示担忧。

阅读更多
未分类 罗马尼亚大选

struct sockaddr伪灵活数组的麻烦

2024-11-29

本文讨论了Linux内核中struct sockaddr结构体中的sa_data字段带来的问题。sa_data最初设计为固定长度,但随着网络协议的发展,其长度不足以容纳所有地址类型,因此在实践中被当作灵活数组使用。这种用法导致编译器难以进行边界检查,从而带来安全隐患。内核开发者尝试通过多种方式解决这个问题,包括重新定义struct sockaddr,引入sockaddr_storage和sockaddr_legacy等变体,但都存在兼容性问题。最终,开发者计划逐步淘汰内核内部对struct sockaddr的使用,以改进内存安全。

阅读更多
7
未分类 sockaddr
1 2 42 43 44 46 48 49 50 514 515