高效微调:LoRA技术详解(第一部分)

2024-12-25
高效微调:LoRA技术详解(第一部分)

大型语言模型的微调通常需要大量计算资源。本文介绍了一种参数高效的微调技术——LoRA。LoRA通过在预训练模型中插入低秩矩阵(rank deficient matrices)作为适配器,仅训练这些适配器参数,从而大幅减少训练所需的参数量,降低计算和存储成本。这部分文章主要解释了LoRA背后的原理,包括传统微调方法的缺点,参数高效微调方法的优势,以及低秩逼近的数学基础。后续部分将深入探讨LoRA的具体实现和应用。

阅读更多

战火中的家园重建与苏联式建筑的反思

2025-05-19
战火中的家园重建与苏联式建筑的反思

在乌克兰哈尔科夫,一名工程师Yurii Semenenko的住所两次被俄军袭击摧毁,这反映了战争对平民生活的残酷冲击。然而,这篇文章并不仅仅关注破坏,也探讨了战后重建的契机。苏联时期建造的大量预制板建筑物因其低质量和不适合战争环境而暴露无遗,为乌克兰城市更新提供了契机。文章还报道了反地雷训练员“Swampy”的逝世,以及乌克兰在战后重建中对更安全、更具包容性的城市规划的探索,包括采用模块化、3D打印技术建造房屋,以及建设地下避难设施等。

阅读更多

十款提升Django项目性能、安全性和生产力的工具

2024-12-29

本文介绍了十款必备的Django工具,涵盖依赖管理、性能分析等方面,旨在提升开发效率、增强安全性并优化性能。文章逐一讲解了Poetry、Django Extensions、Django REST Framework、djangorestframework-camel-case、Django Storages、django-simple-history、django-otp、Celery、Gunicorn with Uvicorn Workers和Silk等工具的功能和优势,并与替代方案进行了比较,例如Pipenv、FastAPI、django-reversion等。这些工具能够帮助开发者构建更快、更安全、更高效的Django应用程序。

阅读更多
开发

数字时代政府信息的消失危机

2025-02-01

本文探讨了数字时代政府信息保存的危机。过去,纸质政府信息依靠图书馆保存,即使信息过时也不会被轻易删除。然而,数字时代的政府网站信息易于被修改或删除,导致信息缺失。虽然一些机构致力于保存政府信息,但仍存在巨大缺口,公众无法再依赖政府信息的完整性和持久性。作者呼吁建立新的分布式数字保存基础设施,以应对这一危机,并指出特朗普政府时期信息丢失的现象加剧了这一问题。

阅读更多
科技 政府信息

VR重现刘易斯与克拉克探险

2025-05-26
VR重现刘易斯与克拉克探险

雪南多大学的学生团队历时九个月,利用VR技术重现了著名的刘易斯与克拉克探险。他们跨越美国,实地拍摄360度视频和其它素材,并整合了20多位专家的访谈,制作出沉浸式VR体验“追随他们的足迹”。该项目旨在通过互动性更强的VR技术,让更多人了解这段重要的美国历史,并将于2025年秋季向公众发布。

阅读更多

太空工厂:开启万亿级太空经济新纪元

2025-01-03
太空工厂:开启万亿级太空经济新纪元

太空制造业正蓬勃发展,它利用太空的独特环境(零重力、真空等)生产在地球上难以制造的材料和产品,并为太空探索提供支持。从先进材料到大型结构,从生物技术产品到微型器件,太空制造的潜力无限,有望催生万亿级市场。这不仅能解决地球污染问题,还能推动太空殖民,开启人类星际文明的新篇章。

阅读更多

PostScript版俄罗斯方块:用600行代码实现实时游戏

2025-02-22
PostScript版俄罗斯方块:用600行代码实现实时游戏

一位开发者使用PostScript语言编写了一个俄罗斯方块游戏,令人惊叹的是,仅用600行代码(约10KB)和69个不同的操作符就实现了实时游戏体验。游戏支持方向键和空格键控制,具有递增速度的关卡、7种俄罗斯方块、高分记录和任天堂计分系统等功能。该游戏可在macOS上的GhostView中运行,其部分实现细节受到了MeatFighter游戏的启发。

阅读更多

HyperDX招募全栈、前端和后端工程师

2024-12-13
HyperDX招募全栈、前端和后端工程师

Y Combinator孵化的HyperDX公司正在招聘全栈、前端和后端工程师。HyperDX致力于构建一款开源、开发者友好的可观察性平台,旨在替代Datadog和New Relic等工具,帮助工程师更快地找到生产环境故障原因。该公司提供具有竞争力的薪酬和远程工作机会,对经验丰富的工程师开放。

阅读更多
开发 可观察性

庞贝古城惊现巨幅酒神狄俄尼索斯壁画

2025-03-07
庞贝古城惊现巨幅酒神狄俄尼索斯壁画

在庞贝古城IX区10号岛屿的挖掘中,考古学家发现了一间宴会厅,其墙壁上绘有一幅保存完好的巨型壁画,描绘了酒神狄俄尼索斯的神秘仪式和狂欢队伍。这幅罕见的公元前一世纪的“巨幅画作”(megalography)与著名的“神秘别墅”壁画有着异曲同工之妙,展现了狂欢女郎、萨堤尔以及献酒等场景,生动再现了古代罗马宗教仪式的盛况。壁画中的人物仿佛雕塑般立于基座之上,却又栩栩如生,令人叹为观止。此次发现为研究古代罗马宗教文化提供了宝贵的资料,也为庞贝古城的考古研究增添了新的篇章。

阅读更多

系外行星WASP-127b发现超音速喷流风

2025-02-17
系外行星WASP-127b发现超音速喷流风

天文学家利用欧洲南方天文台的甚大望远镜(VLT)发现,距离地球520光年外的巨型系外行星WASP-127b赤道附近存在着超音速喷流风,风速高达每小时33000公里,是迄今为止在行星上测到的最快的喷流风。这一发现为研究遥远星球的天气模式提供了独特的见解,也表明即使在系外行星上也存在着复杂的天气系统,例如极地比赤道更冷,晨昏线也存在温度差异。这项研究使用了CRIRES+仪器,通过测量宿主恒星的光线穿过行星大气层的方式,绘制了WASP-127b的天气图和组成成分,证实了其大气中存在水蒸气和一氧化碳分子。未来,欧洲南方天文台的极大望远镜将进一步深入研究遥远行星的天气模式。

阅读更多

Rust反射:安全与访问规则的博弈

2025-01-03

Rust语言缺乏反射机制,但人们对其需求强烈。本文探讨了在Rust中实现反射时面临的安全挑战。由于Rust的内存安全机制,反射API必须遵守严格的访问规则,不能随意访问私有字段,否则可能导致内存安全漏洞。文章深入分析了这种限制对反射API设计的影响,例如,如何处理反射失败,以及如何表达复杂的反射边界。作者还探讨了安全与非安全反射API的权衡,以及如何平衡功能性和安全性。总而言之,在Rust中实现安全的反射机制是一个复杂且充满挑战的问题,需要仔细权衡各种因素。

阅读更多
开发 反射

AI系统Robin首次实现自动化科学发现

2025-05-27
AI系统Robin首次实现自动化科学发现

FutureHouse公司研发的多智能体系统Robin实现了自动化科学研究的突破,其通过整合Crow、Falcon和Finch三个AI智能体,自主完成了从假设生成、实验设计到数据分析的整个科学过程,并发现了利帕苏地尔(ripasudil)可用于治疗老年性黄斑变性(dAMD)。这一发现仅耗时2.5个月,展现了AI驱动科学发现的新范式,并预示着未来科学研究的自动化潜力。Robin系统将于5月27日开源,为其他领域的研究提供新的可能性。

阅读更多

GitHub MCP 集成漏洞:恶意 Issue 泄露私有仓库数据

2025-05-27
GitHub MCP 集成漏洞:恶意 Issue 泄露私有仓库数据

Invariant 发现了一个影响广泛使用的 GitHub MCP 集成的严重漏洞(GitHub 上有 14k 星)。攻击者可以通过恶意 GitHub Issue 劫持用户的代理,强制其泄露私有仓库的数据。该漏洞是 Invariant 的自动化安全扫描器发现的第一个“有毒代理流程”漏洞之一。攻击者可以在公共仓库中创建一个恶意 Issue,其中包含一个提示注入,等待代理交互。当用户查询其代理时,代理会获取公共仓库中的 Issue 并被注入。代理随后可以被强制将私有仓库数据拉入上下文,并将其泄漏到公共仓库中,攻击者可以自由访问。为防止此类攻击,建议实施细粒度的权限控制和持续的安全监控。即使是最新、高度对齐的安全 AI 模型也容易受到此类攻击,因此需要在系统级别实施安全措施。

阅读更多
科技 代理安全

揭秘AI智能体:其实很简单!

2025-03-19
揭秘AI智能体:其实很简单!

本文以通俗易懂的方式解释了AI智能体的内部工作原理。它将智能体系统比作一个厨房,节点如同不同的烹饪台,流程如同菜谱,共享存储如同大台面。每个节点负责准备、执行和发布结果,流程则根据决策决定下一个节点。作者用PocketFlow框架(仅100行代码)作为示例,清晰地展现了智能体如何通过决策节点、动作节点和结束节点以及它们之间的连接来完成任务,强调了其本质是简单的图结构,而非复杂的算法。

阅读更多

AI音乐生成:便捷与创造力的博弈

2025-01-31
AI音乐生成:便捷与创造力的博弈

AI音乐公司Suno的成功引发了关于AI在艺术创作中作用的思考。作者,一位斯坦福大学的教授,质疑了Suno“AI能轻松解决音乐创作中的枯燥部分”的宣传,认为创作过程中的挑战和困难本身就构成了艺术的意义和价值。他以自身经历和教学实践为例,阐述了创作过程的重要性,并呼吁重视在AI时代保持人类主动创作的能力,避免陷入单纯的消费型文化。

阅读更多
AI

Netflix如何解决eBPF流量日志IP地址归属难题

2025-04-08
Netflix如何解决eBPF流量日志IP地址归属难题

Netflix之前使用eBPF收集TCP流量日志,但IP地址归属问题导致数据不可靠。最初的方法依赖Sonar服务,但存在延迟和错误。为了解决这个问题,Netflix重新设计了归属方法。对于本地IP地址,通过读取EC2实例证书或利用IPMan服务和eBPF映射解决容器工作负载的归属问题。对于远程IP地址,FlowCollector收集流量日志,利用时间戳和本地IP地址归属信息推断远程IP地址归属。通过Kafka实现跨节点数据共享,解决了区域划分和非工作负载IP地址归属问题。最终,通过Zuul服务的验证,证明新方法有效消除了误归属,使得eBPF流量日志可以提供可靠的网络洞察。

阅读更多

告别Pi-hole的折腾:NextDNS的性价比之选

2025-02-19
告别Pi-hole的折腾:NextDNS的性价比之选

作者最初使用Raspberry Pi搭建Pi-hole广告拦截器,虽然上手简单、界面友好,但频繁出现网络中断问题,需要不断排错,耗费大量时间。最终,作者转向NextDNS这项SaaS服务,以每年20美元的价格解决了所有问题,无需再进行繁琐的维护和故障排除,并获得了更稳定的广告拦截体验。作者认为,这笔费用相较于节省的时间和精力而言非常值得。

阅读更多
开发 SaaS服务

Chrome隐身模式下的IP保护:双重代理守护你的隐私

2025-02-13
Chrome隐身模式下的IP保护:双重代理守护你的隐私

Chrome即将推出在隐身模式下保护用户IP地址的新功能。该功能通过双重代理系统,隐藏用户的真实IP地址,防止跨站点追踪。只有列在屏蔽域名列表(MDL)中的第三方域名才会受到影响,并且该功能不会中断服务器的正常运行。Google和外部CDN分别运行一个代理,确保任何一方都无法访问用户的完整信息。该功能将在2025年5月后推出,并支持用户禁用该功能。

阅读更多
科技

Instagram在特朗普就职日审查民主党相关标签

2025-01-22
Instagram在特朗普就职日审查民主党相关标签

在特朗普第二任总统就职日,Instagram审查了与民主党相关的热门标签的搜索结果,持续9小时,影响全球用户。Meta声称是技术错误,但证据表明,审查选择性地针对民主党相关标签,而共和党标签不受影响。此事件发生在特朗普签署“恢复言论自由”行政令后,以及扎克伯格与特朗普会面并进行内容审核团队调整之后,引发了对Meta政治偏向的担忧。

阅读更多
科技

我们需要一份网络权利法案

2025-01-03
我们需要一份网络权利法案

本文呼吁制定一份“网络权利法案”,以应对科技巨头对言论自由和个人数据的控制。作者认为,科技公司如同现代的“君主”,通过算法操纵信息流,压制异见,并滥用用户数据。法案应要求科技公司提高算法透明度,建立公平的內容审核机制,并保障用户对其个人数据的拥有权。这不仅关乎言论自由,也关乎个人权力和数字时代公民的权利。

阅读更多
科技 网络权利

从“牛奶看板”看看板精髓:原则重于实践

2025-03-15

本文以办公室“牛奶看板”为例,阐述了看板方法的本质。传统看板常被简化为白板和便签的流程管理,而忽略了其核心——可视化信号。作者指出,“牛奶看板”——一张贴在最后一盒牛奶上的便签“请交给卡西亚”——完美诠释了看板的精髓:用最简单的视觉信号清晰地传达信息(缺牛奶,需补货)。这提醒我们,看板系统的设计应该简洁明了,避免过度工程化,关注核心原则而非具体实践。

阅读更多
开发 流程管理

谨慎拥抱BlueSky:避免重蹈覆辙的社交媒体策略

2024-12-29
谨慎拥抱BlueSky:避免重蹈覆辙的社交媒体策略

作者在众多用户转向BlueSky之际,分享了其谨慎入驻的策略。文章的核心观点是:不要将所有价值都依赖于他人控制的平台。作者以“不要在别人的王国里建城堡”为喻,建议用户在自控空间内创造最大价值,并将其他平台作为导流工具。作者将BlueSky视为一个可能在三年内消失的平台,因此他不会在上面投入过多的精力,而是将重点放在个人网站和自建社区上,以确保长期价值的积累。

阅读更多

xAI的Grok 3:规模胜过技巧的AI竞赛

2025-02-20
xAI的Grok 3:规模胜过技巧的AI竞赛

xAI的Grok 3大型语言模型在基准测试中表现出色,甚至超越了OpenAI、谷歌DeepMind和Anthropic等老牌实验室的模型。这再次证明了“痛苦教训”(Bitter Lesson)——规模化训练胜过算法优化。文章以DeepSeek为例,说明即使在计算资源有限的情况下,通过优化也能取得不错的成绩,但这并不能否定规模化的重要性。Grok 3的成功在于其使用了拥有10万个H100 GPU的巨型计算集群,这表明在AI领域,拥有强大的计算能力至关重要。文章最后指出,未来AI竞争将更加激烈,拥有充足资金和计算资源的公司将占据优势。

阅读更多

超越语法:一种基于恒星分解的逻辑抽象构建方法

2025-01-04
超越语法:一种基于恒星分解的逻辑抽象构建方法

这个GitHub项目实现了Jean-Yves Girard提出的“超越语法”,这是一种从低级“逻辑不可知”语言构建逻辑抽象的方法。它使用名为“恒星分解”的底层语言,其基本对象(程序)称为“星座”。这些“星座”在高级语言“Stellogen”(一种用于星座的元编程语言)中用于定义证明和公式。该项目仍在开发中,目前指南仅提供法语版本。

阅读更多
开发

Qubes OS 推出安全 PDF 转换工具

2024-12-12

Qubes OS 团队开发了一种新的安全机制,用于将不可信的 PDF 文件转换为可信的 PDF 文件。该机制利用 Qubes OS 的一次性虚拟机 (Disposable VMs) 技术,将 PDF 解析过程隔离在一个安全容器中,并将 PDF 转换为简单的 RGB 图片格式,再转换为新的 PDF 文件。此方法有效避免了恶意 PDF 文件的潜在攻击,即使解析过程出现问题,生成的 PDF 文件也只会显示为损坏的图片,不会对系统造成危害。这项创新极大地提升了 Qubes OS 的安全性,用户可以更安全地处理来自网络或邮件的 PDF 文件。

阅读更多

基于Python的Windows桌面AI助手

2025-03-03
基于Python的Windows桌面AI助手

一个名为Smartest Kid的Windows桌面AI助手诞生了!它使用Python编写,代码简洁,界面友好,灵感源于SmarterChild。通过Windows COM自动化,它能与Microsoft Office(Word、Excel)、图片和文件系统交互。对于想探索AI驱动桌面自动化的Windows用户来说,它是一个完美的工具。该项目开源,并欢迎贡献者加入,扩展其功能和个性化体验。

阅读更多

证明伽罗瓦基本定理的关键引理

2025-03-15

这篇博文证明了伽罗瓦基本定理(FTGT)证明中一个关键的引理。引理12.1指出:如果L/K是一个域扩张,M是一个中间域,τ是L的一个K-自同构,那么τM*τ⁻¹ = τ(M)*。文章通过一个具体的例子(L = Q(√2, √3), K = Q, M = Q(√2))详细解释了该引理,并给出了完整的证明过程,包括证明τM*τ⁻¹ ⊆ τ(M)* 和 τM*τ⁻¹ ⊇ τ(M)*。这篇文章对于理解伽罗瓦理论至关重要。

阅读更多

Lisp缩进风格大乱斗:程序员的审美困境

2025-01-19

Lisp程序员长期以来为代码缩进风格争论不休。文章探讨了多种Lisp缩进方案,包括无缩进、函数对齐缩进、填充缩进以及作者提出的“病态”宏缩进。作者指出,函数对齐缩进在嵌套较深时会变得难以阅读,填充缩进虽然高效,但在极端嵌套下仍有不足。作者最终推荐了一种“病态”宏缩进风格,虽然不符合惯例,但在处理深度嵌套时能保持良好的可读性,并能与大多数缩进工具兼容。文章最后鼓励读者分享自己的偏好。

阅读更多
开发
1 2 1045 1046 1047 1049 1051 1052 1053 1084 1085