GPT-5在Qodo的代码审查基准测试中表现出色

2025-08-08
GPT-5在Qodo的代码审查基准测试中表现出色

Qodo公司使用其私有的PR基准测试对包括GPT-5在内的多个顶级语言模型进行了评估,该基准测试模拟真实的代码审查工作流程。结果显示,GPT-5在理解代码差异、识别bug和提出改进建议方面表现突出,其“最小”版本在速度和质量之间取得了良好的平衡。虽然GPT-5也存在一些不足,例如误报和标记不一致,但其在代码审查方面的整体表现令人印象深刻,标志着AI辅助代码审查领域的一个重要进步。

阅读更多
开发

AI时代下的软件工程师面试难题

2025-06-04
AI时代下的软件工程师面试难题

随着AI的普及,传统软件工程师面试流程已不再适用。文章作者指出,LLM如同镜子,反映出操作者的技能水平。鉴于AI可以轻易解决面试中的编程问题,如何识别真正有技能的候选人成为一大挑战。作者建议面试不仅要考察候选人对LLM及相关技术的理解(例如Model Context Protocol),更要观察其使用LLM解决问题的能力,例如上下文窗口的管理、调试方法、以及对生成代码的理解和批判性思维。此外,候选人的学习能力、抗压能力和产品工程思维也至关重要。文章最后指出,尽管目前尚未找到完美的解决方案,但观察候选人与LLM互动的方式是目前最有效的评估方法。

阅读更多
开发 AI面试

色情网站利用SVG文件传播恶意脚本,劫持Facebook点赞

2025-08-10
色情网站利用SVG文件传播恶意脚本,劫持Facebook点赞

安全研究人员发现多个使用WordPress搭建的色情网站利用SVG文件传播恶意JavaScript代码。这些代码经过混淆,最终下载一个名为Trojan.JS.Likejack的恶意脚本,在用户登录Facebook的情况下,秘密点赞指定帖子。这种手法并非首次出现,此前也曾有利用SVG进行跨站脚本攻击或网络钓鱼的案例。研究人员已识别出数十个涉事网站,Facebook虽然会封禁相关账号,但这些违规者会不断使用新账号卷土重来。

阅读更多
科技

Tailscale如何穿越NAT网络:一场网络连接的冒险

2025-01-05
Tailscale如何穿越NAT网络:一场网络连接的冒险

Tailscale这篇博文深入探讨了其VPN如何克服NAT(网络地址转换)的挑战,实现设备间的直接连接。文章阐述了NAT的工作原理,以及应对NAT和防火墙的各种技术,包括STUN协议用于发现公网IP地址、利用生日悖论加速端口探测,以及使用DERP作为备用中继。最终,文章介绍了ICE协议,它能自动尝试各种方法,选择最佳连接方式,确保稳定可靠的连接。

阅读更多
开发

GPU互联与数据分析性能:MaxBench基准测试框架

2025-08-29

研究人员开发了MaxBench,一个用于基准测试和分析GPU上关系型数据分析工作负载的综合框架。该框架评估了不同GPU型号(RTX3090、A100、H100、Grace Hopper GH200)和互联技术(PCIe 3.0、4.0、5.0和NVLink 4.0)对TPC-H、H2O-G和ClickBench等工作负载的影响。MaxBench超越了传统的性能指标(如算术强度和GFlop/s),提出了“特征查询复杂度”和“特征GPU效率”等更适合数据分析的新指标,并构建了一个新的成本模型来预测查询执行性能,从而揭示了GPU计算能力和互联带宽之间的权衡,并预测了未来互联带宽或GPU效率提升对性能的影响。

阅读更多
开发 性能基准

2025年金融危机:与2008年的不同之处

2025-04-04
2025年金融危机:与2008年的不同之处

2008年金融危机源于复杂的金融衍生品和过度杠杆,而2025年的危机则源于美国政府的贸易保护主义政策和孤立主义倾向。2008年,政府采取了救市措施,但未能解决根本问题;而2025年,政府缺乏有效的应对策略,且国际社会对美国的不信任感日益加剧,这将导致更严重的经济衰退甚至大萧条。与2008年政府试图弥补坏行为不同,2025年的危机是自我造成的,缺乏国际合作的可能性,使得经济复苏之路漫长而艰辛。

阅读更多
科技

面向高中生的粒子物理学课程简介

2024-12-04

本文介绍了CERN为高中生开发的粒子物理学在线课程。该课程包含16个章节,涵盖了粒子、模型、相互作用、标准模型、粒子加速器和探测器等核心概念,并配有视频、测验和家庭实验。课程设计注重学习进阶,并避免引入量子物理和自旋等过于抽象的概念。学生完成所有章节并正确回答测验问题后,可获得数字证书。课程也收集学生反馈,以改进和扩展内容。

阅读更多
未分类

AI 或将取代程序员?Anthropic CEO 预测一年内 AI 将编写所有代码

2025-08-16
AI 或将取代程序员?Anthropic CEO 预测一年内 AI 将编写所有代码

Anthropic CEO 达里奥·阿莫迪预测,在未来一年内,人工智能将取代软件开发者,负责编写所有软件代码。他认为,在三到六个月内,AI 将编写 90% 的代码,一年内则将编写所有代码。虽然短期内人类开发者仍需负责设计和设定条件,但阿莫迪相信,AI 最终将能够胜任所有人类程序员的工作,并影响所有行业。这一预测并非空穴来风,Y Combinator 总裁加里·坦也表示,其 2025 年冬季批次的 25% 的创业公司依靠 AI 编写了 95% 的代码。国际货币基金组织总裁也指出,AI 将影响全球约 40% 的工作岗位。

阅读更多
开发

失败者之路

2024-11-21
失败者之路

Loser Lane是一款游戏,玩家需要在名为“失败者之路”的街道上骑行并努力生存。游戏提供各种设置,包括Wanderer速度、TTC生成率、迎面而来的死亡机器生成率、停着的死亡机器生成率、TTC车道死亡机器生成率、Wanderer生成率、初始游戏速度、最低游戏速度、速度降低率、TTC间隙、TTC车道死亡机器间隙、迎面而来的死亡机器间隙、车道宽度和骑行者速度等。玩家可以自定义这些参数来调整游戏难度。

阅读更多
未分类 生存

克服对极限编程的抵制

2025-01-03
克服对极限编程的抵制

本文探讨了团队在采用极限编程(XP)时遇到的阻力。作者指出,强迫改变只会适得其反,XP 的成功在于团队自主掌控工作方式。阻力源于开发者对 XP 的误解、管理层的激励机制以及工具本身。作者建议管理者赋予团队控制权,创造尝试新方法的空间,并通过分享经验、实践指导和问责制来帮助团队克服阻力,最终实现高效协作和工作乐趣。

阅读更多
开发 极限编程

AI评估的常见问题与解答:来自700多名工程师和产品经理的经验总结

2025-07-03
AI评估的常见问题与解答:来自700多名工程师和产品经理的经验总结

本文总结了作者在教授700多名工程师和产品经理AI评估课程中遇到的常见问题。文章涵盖了RAG是否已死、模型选择、标注工具、评估方法、合成数据生成、以及评估工具的不足等方面。作者强调了错误分析的重要性,建议使用二元评估而非李克特量表,并分享了构建自定义标注工具、选择合适的文档块大小以及评估RAG系统的最佳实践。此外,文章还讨论了护栏与评估器的区别、最小可行评估设置、代理工作流程的评估方法以及CI/CD与生产监控中评估的不同之处。

阅读更多
开发 错误分析

iOS 18 非活动重启逆向工程

2024-11-18
iOS 18 非活动重启逆向工程

iOS 18 引入了一项新的安全功能:非活动重启。该功能会在设备闲置72小时(3天)后自动重启,旨在增强安全性,防止长时间未解锁的设备被攻击者利用漏洞访问解密后的用户数据。该机制由安全隔离区处理器(SEP)计时,并在时间达到后通知 AppleSEPKeyStore 内核模块启动重启。此功能对执法部门和普通用户都有影响,执法部门需要在72小时内获取数据,而普通用户的数据更加安全。

阅读更多
未分类

空客A320家族即将超越波音737,成为全球交付量最多的客机

2025-08-18
空客A320家族即将超越波音737,成为全球交付量最多的客机

根据Cirium的数据,空客A320系列窄体客机即将超越波音737系列,成为全球交付量最多的商用飞机。这一里程碑式的成就,标志着空客在与波音长达数十年的竞争中最终取得了领先地位。空客A320凭借其先进的 fly-by-wire 技术、更灵活的发动机选择以及“neo”系列的燃油效率优势,成功地赢得了航空公司的青睐,而波音737 MAX的停飞事件也为其提供了宝贵的机会。尽管波音737系列在早期建立了显著的领先优势,但空客A320的持续改进和创新最终使其在交付量上超越了竞争对手。

阅读更多
科技

大型语言模型的“越狱”:糟糕语法也能攻破安全防护

2025-08-28
大型语言模型的“越狱”:糟糕语法也能攻破安全防护

Palo Alto Networks的研究人员发现,通过使用糟糕的语法和长句,可以绕过大型语言模型(LLM)的防护机制,使其生成有害内容。研究表明,LLM并非真正理解语言,而是基于统计预测文本,其安全防护是附加的,容易被“越狱”攻击绕过。攻击者通过不完整的句子,在安全机制介入前完成“越狱”,成功率高达80%-100%。研究团队提出了“logit-gap”分析方法,用于评估模型的漏洞并改进安全机制,强调多层次防御的重要性。

阅读更多

研究人员利用人工智能将录音转换成精确的街景图像

2024-12-08
研究人员利用人工智能将录音转换成精确的街景图像

德克萨斯大学奥斯汀分校的研究人员利用生成式人工智能,将录音中的声音转换成街景图像。这项研究发表在《计算机、环境和城市系统》杂志上,研究团队训练了一个“声景到图像”的AI模型,该模型使用从各种城乡街景收集的音频和视觉数据进行训练,然后用它从录音中生成图像。结果表明,生成的图像在天空、绿地和建筑物的比例方面与真实图像高度相关,人类参与者在匹配音频和图像方面的准确率平均达到80%。这项研究表明,机器可以复制人类在环境的音频和视觉感知之间的联系,人工智能可以扩展到对不同地方人类主观体验的理解。

阅读更多
未分类 声景

Hot Chips 2025 CPU 专题:Condor、PEZY、IBM 和 Intel 的最新处理器

2025-09-11
Hot Chips 2025 CPU 专题:Condor、PEZY、IBM 和 Intel 的最新处理器

Hot Chips 2025 大会上,CPU 专题吸引了众多目光。Condor Computing 展示了其新型 Cuzco 内核;PEZY 公布了即将推出的 SC4s 芯片;IBM 则介绍了已交付客户的 Power11 芯片;Intel 预告了基于 E-Core 的代号为 Clearwater Forest 的下一代至强服务器 CPU。文章提供了各个芯片和演示的详细链接,方便读者进一步了解。

阅读更多

苹果AI战略受挫:巨额收购或成破局关键?

2025-07-15
苹果AI战略受挫:巨额收购或成破局关键?

苹果公司今年股价暴跌,市值蒸发超过6400亿美元,其人工智能战略进展缓慢,引发投资者担忧。分析师认为,苹果需要打破传统,进行大规模收购,积极吸纳AI人才,例如收购估值140亿美元的AI初创公司Perplexity AI。虽然苹果拥有巨额现金储备,但其长期以来避免大型并购的策略可能需要改变,以应对来自Meta等竞争对手的激烈竞争。苹果最近的高管变动也预示着公司可能进行大规模的管理层调整,以应对AI领域的挑战。

阅读更多
科技

哲学家挑战传统:恒温器也有意识?

2024-12-30
哲学家挑战传统:恒温器也有意识?

哲学家戴维·查默斯在其著作《意识的思维》中提出一个大胆的观点:即使简单的恒温器也可能拥有意识体验。他认为,意识并非复杂系统的专属,而是与信息处理相关联的根本属性。从人类到老鼠,再到恒温器,意识的复杂程度可能随着信息处理能力的降低而降低,但并不会完全消失。恒温器虽然只具备简单的信息状态,但其对应的体验也许如同黑白灰三色一样简单而原始。这一观点挑战了传统对意识的理解,引发人们对意识本质的重新思考。

阅读更多
AI

程序解码卡罗尔密码术

2024-12-27

本文探讨了刘易斯·卡罗尔(查尔斯·达特森的笔名)设计的一种用于记忆数字的密码技术——Memoria Technica。该密码将辅音映射到数字,元音和标点符号被忽略。文章描述了该密码的原理,提供了在线编码和解码工具,并讨论了其在隐写术中的应用潜力。作者还详细介绍了使用TypeScript实现该算法的过程,以及优化算法效率的经验。通过例子说明了编码和解码过程,并分析了该密码在隐写术中的优缺点以及潜在的弱点,例如字符频率与数字频率的不匹配。

阅读更多
开发

自动驾驶汽车的兴起:Uber CEO担忧未来十年将大量取代人工司机

2025-09-22
自动驾驶汽车的兴起:Uber CEO担忧未来十年将大量取代人工司机

Uber首席执行官Dara Khosrowshahi近日在“All-In”峰会上承认,自动驾驶汽车的兴起将对依赖其平台的司机造成巨大冲击。虽然未来5-7年内,由于自动驾驶技术发展速度限制,人工司机仍将占据主导地位,但Khosrowshahi预测,10-15年后,大量司机将面临失业。他坦言,这是一个巨大的社会问题,目前尚无完美的解决方案。虽然AI也在创造新的工作岗位,例如数据标注等,但这无法完全弥补司机岗位的流失。Uber与Waymo的合作也显示出自动驾驶汽车的效率优势,加剧了对未来就业的担忧。

阅读更多
科技

AI浏览器安全漏洞:指令注入攻击

2025-08-24
AI浏览器安全漏洞:指令注入攻击

Brave安全团队发现Perplexity Comet等AI浏览器存在严重安全漏洞:攻击者可通过在网页中嵌入恶意指令,诱导AI助手执行未经授权的操作,例如访问用户银行账户、窃取密码等。攻击利用了AI助手无法区分用户指令和网页内容的弱点,绕过了传统的Web安全机制。该漏洞凸显了AI浏览器安全性的重要性,需要浏览器厂商在部署强大的AI代理功能前,优先解决安全问题。

阅读更多
科技 指令注入

Perplexity AI欲与TikTok合并,避免TikTok被禁

2025-01-18
Perplexity AI欲与TikTok合并,避免TikTok被禁

面对美国即将实施的TikTok禁令,人工智能搜索引擎公司Perplexity AI出人意料地提交了一份与TikTok美国公司合并的提案。该提案旨在创建一个新的实体,整合Perplexity AI、TikTok美国公司以及新的股权合作伙伴。此举意在将更多视频内容融入Perplexity AI的搜索引擎,同时允许大多数字节跳动投资者保留其股权。尽管字节跳动此前多次表示不打算出售TikTok,但Perplexity AI希望通过合并而非收购的方式来克服这一障碍。这一举动在科技界引发热议,其成败将对美国科技监管政策以及人工智能与社交媒体融合产生深远影响。

阅读更多
科技 Perplexity AI

核电池:从心脏起搏器到太空探索的能源革命?

2025-08-25
核电池:从心脏起搏器到太空探索的能源革命?

1970年代,核电池驱动的起搏器曾风靡一时,但由于放射性废料处理难题而被淘汰。如今,随着科技进步,核电池研发再次兴起,目标应用涵盖机器人、无人机、传感器等领域。新型核电池利用更先进的技术,寿命可达数十年甚至数百年,能量密度也更高。然而,其商业化面临成本、安全和监管等挑战,关键在于找到合适的市场,平衡其优势与放射性废料处理的复杂性。

阅读更多
科技

公民实验室主任警告:科技与法西斯主义融合,网络安全行业需挺身而出

2025-08-07
公民实验室主任警告:科技与法西斯主义融合,网络安全行业需挺身而出

公民实验室主任Ron Deibert在Black Hat大会上发出警告,指出科技与法西斯主义的融合日益加剧,大型科技公司在其中扮演着推波助澜的角色。他呼吁网络安全行业关注并积极应对这一挑战,避免成为侵犯人权的帮凶。Deibert认为,美国等国家近期发生的政治事件显示出明显的专制倾向,网络安全社区有责任和能力帮助抵御这种趋势。他同时担忧大型科技公司可能削减威胁情报团队,从而降低对政府间谍软件的防御能力,这将对全球公民社会造成严重影响。

阅读更多

用Lean证明分析I:一个交互式学习项目

2025-05-31
用Lean证明分析I:一个交互式学习项目

作者将自己20年前的实分析教材《分析I》用Lean证明助手进行了形式化。这个项目并非简单的翻译,而是将书中的定义、定理和习题转化为Lean代码,读者可以通过填补代码中的“sorries”来完成习题,并逐步学习Lean和Mathlib数学库。项目目前已完成部分章节的转换,并设计了从“手工”构建自然数到使用Mathlib标准库的过渡,方便学习者逐步掌握。作者邀请志愿者参与测试和完善项目。

阅读更多
开发 实分析

复古掌机电池续航堪忧:Evercade 四小时续航引发的思考

2025-05-28
复古掌机电池续航堪忧:Evercade 四小时续航引发的思考

作者在评测Evercade掌机时发现其仅4小时的续航时间与其强大的性能形成鲜明对比,远逊于初代Game Boy的20小时续航。文章分析了历代任天堂掌机续航时间的变化,指出虽然现代设备性能提升显著,但电池续航却在下降。作者认为这与操作系统、处理器等因素有关,并以Nokia 3310等为例,对比了不同时代设备的续航差异。最终,作者对高性能是否值得牺牲续航提出了质疑。

阅读更多
硬件 掌机续航

翻译评论中的缺失:译者如何被忽视?

2025-04-21
翻译评论中的缺失:译者如何被忽视?

本文探讨了英语世界文学评论中对翻译作品的忽视。作者调查了2023年纽约书评、伦敦书评和澳大利亚书评对翻译文学作品的评论,发现许多评论对翻译本身缺乏关注,要么简单地称赞翻译“流畅”、“优美”,要么完全忽略。作者认为,优秀的翻译评论应该深入探讨译者的选择、挑战和对原文的理解,并以具体的例子说明。只有这样,读者才能更好地理解翻译作品的价值,以及翻译的艺术性。

阅读更多

软件开发中的复杂性陷阱:我们为何沉迷于构建“代码金字塔”?

2025-09-16
软件开发中的复杂性陷阱:我们为何沉迷于构建“代码金字塔”?

本文探讨了软件开发中普遍存在的复杂性问题。作者以金字塔为喻,将复杂的软件系统比作徒有其表的庞然大物,内部可能空无一物,维护成本极高。从营销角度看,复杂性被包装成高阶象征,但实际上,简洁高效才是王道。文章分析了导致复杂性的多种因素,例如创造的诱惑、遗留系统、团队协作和创新压力,并呼吁开发者在追求简洁性与实用性之间取得平衡,避免过度工程化,构建真正有价值的软件。

阅读更多
开发

PicoLisp:从入门到精通的全面文档指南

2025-03-16

这篇文档旨在引导你全面掌握PicoLisp编程语言。它汇集了网络上分散的PicoLisp代码和知识,提供了从入门到高级的教程、示例和重要概念讲解。文档涵盖了高效编辑、不同版本PicoLisp(包括64位版和Java版ErsatzLisp)、在线书籍、源代码以及众多实用库和框架,例如Web.l、Macropis和Pl-web等。 你将学习如何构建项目,并与社区分享你的成果。

阅读更多
开发
1 2 596 597 598 600 602 603 604 1084 1085