哈佛皮尔斯文稿:8万页手稿的编辑之旅
哈佛大学收藏了超过8万页皮尔斯的手稿,其中大部分从未发表。为了整理这浩如烟海的资料,编辑团队制定了严格的选稿和编辑原则,力求还原皮尔斯最成熟的思想。他们采用现代语言协会的学术编辑标准,对皮尔斯已发表和未发表的作品进行批判性编辑,并利用电子技术提高效率,最终将这些珍贵的学术遗产呈现给世人。
阅读更多
哈佛大学收藏了超过8万页皮尔斯的手稿,其中大部分从未发表。为了整理这浩如烟海的资料,编辑团队制定了严格的选稿和编辑原则,力求还原皮尔斯最成熟的思想。他们采用现代语言协会的学术编辑标准,对皮尔斯已发表和未发表的作品进行批判性编辑,并利用电子技术提高效率,最终将这些珍贵的学术遗产呈现给世人。
阅读更多
IncludeOS 是一款轻量级操作系统,允许开发者在云端运行应用程序,无需传统操作系统。它将操作系统功能集成到应用程序中,从而创建高性能、安全且资源高效的虚拟机。IncludeOS 应用程序启动速度极快(数十毫秒),内存和磁盘占用极低(几兆字节)。开发者可以使用简单的命令行工具进行构建和部署,并提供了丰富的示例和文档,帮助开发者快速上手。
阅读更多
本文深入探讨了HTML中空格处理的复杂性。作者通过大量示例,揭示了HTML处理空格的各种规则,包括内联元素、块级元素、`
`标签和`white-space` CSS属性的差异,以及它们如何导致难以预测的渲染结果。文章还分析了自动化格式化工具、内容管理系统和代码压缩工具在处理HTML空格时面临的挑战。作者提出了一种可能的解决方案:用引号语法区分代码空格和用户可见空格,但承认这将是一个巨大的breaking change。最后,作者建议了一些实用技巧来规避HTML空格处理带来的问题,并提出了添加一个新的HTML实体`&ncsp;`来表示不可折叠空格的想法。阅读更多
Google Gemini在模型能力方面处于领先地位,拥有强大的编码、推理、多模态能力以及超长上下文窗口。然而,其开发者体验却令人失望。API分散在Vertex AI和Google AI Studio两个平台,功能不一致;文档混乱且过时;Vertex AI SDK不支持API密钥认证和微调模型;前缀缓存机制也极其不友好。尽管如此,Gemini模型在长上下文和多模态方面具有成本优势,开发者可能仍需使用它,并借助第三方工具如Vercel AI SDK来改善体验。
阅读更多
1944年,日本秘密向美国发射了数千个“风船炸弹”,企图造成破坏和恐慌。这些由和纸制成的巨大气球携带着燃烧弹和炸弹,借助太平洋的急流飘洋过海。尽管最终仅造成6名美国平民死亡,且对军事目标几乎没有影响,但“风船炸弹”计划依然是二战中一段鲜为人知的奇特篇章,展现了日本在资源匮乏情况下孤注一掷的战争策略,也体现了战争信息管控的复杂性。
阅读更多
据记者Matt Binder及其他用户报告,马斯克旗下的X平台(前身为Twitter)疑似正在屏蔽指向加密消息应用Signal的链接。Signal.me域名链接在公开帖子、私信和个人资料页面均被阻止,系统显示“信息未发送”或“出现错误”等提示。虽然指向Signal账号和Signal主页的链接仍可正常使用,但此前已发布的Signal.me链接现在会显示“警告:此链接可能不安全”的页面。此举引发外界猜测,认为X平台可能出于某种原因限制Signal的使用。
阅读更多
Framework公司发布了Framework Laptop 16的第一个全新扩展坞模块:双M.2适配器,允许用户添加额外的存储驱动器或其他高速设备。此外,他们还更新了Framework Laptop 16的CPU散热解决方案,并推出了包含随机配件的“神秘盒子”,以减少电子垃圾。同时,他们还增加了48GB DDR5内存模块、新款周边产品以及更多地区的配送服务,进一步提升了产品线和用户体验。
阅读更多
谷歌在其面向企业的AI代码辅助工具Gemini Code Assist中增加了对第三方工具的支持。此举旨在通过插件集成Jira、GitHub、Sentry等工具,减少开发者上下文切换的摩擦,提高生产力。目前该功能处于私人预览阶段,仅限Google Cloud合作伙伴使用。此举将Gemini Code Assist与GitHub Copilot Enterprise形成直接竞争,但谷歌强调其在支持本地代码库等方面具有优势。
阅读更多
本文作者认为,AI对齐问题不仅仅是技术难题(如同图中行星般),更重要的是社会选择问题。我们如何通过购买决策、监管、讨论等方式影响AI的发展方向,这才是AI对齐的关键。作者认为,忽视社会选择,只关注技术层面,就好比只关注实验室里的工作,而忽略了整个医疗产业链对药物的影响一样。作者呼吁关注“社会选择”这个更大的问题,并认为改善“社会选择”效率的方案有很多,例如文中提到的公民组织协议。
阅读更多
缅因大学气候变化研究所的Climate Reanalyzer网站提供基于ECMWF ERA5再分析数据的每日全球气温可视化工具。该网站提供交互式图表和地图,展示从1940年至今的每日平均地表气温,并允许用户选择不同的区域进行分析。数据更新存在6-7天的延迟,用户需谨慎对待ERA5估计的极端气温值。网站还提供了其他气候数据,例如海面温度和海冰范围。
阅读更多
尽管Scala的热度已不如2010年代中期,但它仍然保持着稳固的社区和应用。文章探讨了Scala的未来发展方向,两位作者Martin Odersky和Haoyi Li认为Scala需要持续进化,在保持其安全性和便捷性的同时,改进易用性,提升工具链体验,并积极吸纳社区反馈。他们指出,Scala需要在安全性和便捷性之间取得平衡,改进现有功能,并降低新手的学习门槛。文章还讨论了Scala生态系统中的一些挑战,例如IDE支持和构建工具,并提出了相应的解决方案。
阅读更多
作者回顾了从2011年学习Java到2024年转向Go的历程。起初,他偏爱Java的成熟生态和Spring框架,但随着项目的规模和复杂度增加,Java应用的启动速度慢和高资源消耗成为瓶颈。在开发Kubernetes工具和自托管软件分发平台的过程中,作者选择了Go语言,并发现其学习曲线并不陡峭,而快速的启动速度、低资源消耗以及轻量级的生态系统带来了显著的效率提升。虽然Java仍有其优势,但在云原生应用和Kubernetes领域,Go 成为更理想的选择。
阅读更多
本文探讨了嵌入式系统中看门狗定时器的重要性。通过克莱门汀号探测器因看门狗定时器未正确使用而导致任务失败的案例,以及一个厨房排气扇因软件故障需要手动重启的例子,作者强调了可靠看门狗定时器在防止软件故障中的关键作用。文章详细分析了各种看门狗定时器的优缺点,包括内部和外部看门狗定时器,并提出了设计高可靠性看门狗定时器的策略,例如使用窗口看门狗定时器、独立于CPU的外部看门狗以及在多任务系统中监控所有任务状态等。作者建议,即使在看似简单的系统中,也应采取措施防止软件故障,例如定期重置数据结构,以提高系统的可靠性。
阅读更多
本文深入探讨了与至少六起谋杀案相关的跨大陆理性主义邪教“Zizians”。该邪教追随者“Ziz”宣扬极端哲学和奇特的认知理论,吸引了一批信奉“理性主义”并追求自我提升的AI研究人员和慈善家。文章揭示了理性主义社群中滋生的极端主义倾向,以及Zizians如何从最初的AI安全倡导演变为暴力犯罪团伙,引发了对理性主义社群内部文化和潜在风险的反思,属于科技和犯罪的交叉领域。
阅读更多
Koniku公司正尝试用活体神经元制造前所未有的电脑。创始人Oshiorenoya Agabi及其团队在加州伯克利研发一种神经元-硅芯片混合体,名为Koniku Kore,最初用于化学物质检测,未来可能应用于药物研发、农业及神经疾病治疗等领域。该公司已获得部分国防及消费品公司订单,并计划推出开发者芯片。虽然技术面临挑战,如神经元培养及信号解读,但Koniku的创新性在于其将生物与电子融合,向“湿件”人工智能迈进,挑战传统硅基计算的局限性。
阅读更多
艺术家Rafael Araujo以其令人惊叹的几何绘画作品而闻名,他将数学精度与自然之美巧妙融合。他作品中运用黄金螺旋和螺旋线,将科学与艺术和谐统一,创作出栩栩如生的贝壳和蝴蝶图案。Araujo的作品不仅展现了其精湛的绘画技巧,更体现了他对自然界精妙图案的敬畏之情。他甚至出版了成人涂色书,让更多人参与其中,体验艺术的乐趣。
阅读更多
AgentAPI是一个强大的HTTP API,用于控制Claude Code、Goose、Aider和Codex等编码AI代理。它提供了一个统一的聊天界面,允许用户通过简单的API调用与这些代理交互,甚至可以构建一个代理控制另一个代理的MCP服务器。AgentAPI自动处理终端输出,去除冗余信息,并将其解析为独立的消息,简化了与编码AI的交互过程。虽然未来大型语言模型可能推出官方SDK,但AgentAPI致力于成为一个通用的适配器,以便开发者能够轻松切换不同的编码AI代理。
阅读更多
2023年,ChatGPT以惊人的速度获得了1亿用户,引发了AI领域的热潮。本文深入浅出地解释了大型语言模型(LLM)的内部工作机制,包括词嵌入、注意力机制、多头注意力以及Transformer架构的核心组件。作者以通俗易懂的语言,结合图解和例子,阐述了LLM如何通过预测下一个token来生成文本,并解释了从基础模型到指令微调、强化学习的整个过程。文章还介绍了模型卡的解读以及相关学习资源。
阅读更多
本文介绍了一种简单易生成的XOR纹理,它通过对像素的x和y坐标进行异或运算生成。虽然XOR纹理在演示或游戏中并不常用,但它非常适合测试纹理映射器。文章详细解释了XOR运算的原理,并探讨了纹理尺寸对颜色亮度的影响,以及如何使用AND和OR运算符生成类似的纹理。最后,作者展示了XOR纹理在三维纹理中的应用示例。
阅读更多
本文讲述了作者追踪一个DOS 3.3系统命令`SYS.COM`的Bug的故事。该命令用于将引导加载程序复制到磁盘,但在与NetDrive虚拟磁盘镜像一起使用时会导致镜像损坏。通过仔细分析,作者发现`SYS.COM`在使用通用IOCTL调用获取磁盘参数时,没有检查返回代码。当调用失败(例如NetDrive驱动程序不支持该功能)时,`SYS.COM`会错误地写入垃圾数据到磁盘的引导扇区,从而破坏磁盘镜像。该Bug只在某些类型的磁盘镜像(例如硬盘镜像)上出现,因为DOS会尝试获取磁盘几何信息,而软盘镜像则不会。作者最终定位了Bug的根源,并解释了其出现的原因和条件。
阅读更多
文章探讨了为何将大型语言模型(LLM)用于计算。虽然LLM擅长自然语言处理,但研究人员却尝试让其进行数学运算,从简单的加法到复杂的定理证明。这并非为了取代计算器,而是为了探索LLM的推理能力,并最终实现人工通用智能(AGI)。文章指出,人类一直以来都试图利用新技术进行计算,而LLM的数学能力测试是检验其推理能力的一种途径。然而,LLM进行计算的过程与计算器截然不同,前者依赖于庞大的知识库和概率模型,而后者则基于确定的算法。因此,LLM的计算结果并非总是准确可靠,这体现了实用性和研究之间的权衡。
阅读更多
本文探讨了设计令牌在现代UI架构中的作用。通过将设计决策转化为数据,设计令牌作为单一事实来源,实现跨平台自动化代码生成,从而提高设计一致性和更新速度。文章详细介绍了设计令牌的分层组织(选项令牌、决策令牌、组件令牌),自动化分发流程,以及如何选择合适的层数和令牌范围。最终,它阐述了设计令牌的适用场景和局限性,帮助读者判断其是否适合自己的项目。
阅读更多
本文提供了一个通俗易懂的图神经网络(GNN)入门指南。文章首先介绍了图数据及其在现实世界中的应用,例如社交网络、分子结构和文本等。然后,深入探讨了GNN的核心组件,包括消息传递机制、池化操作以及不同类型的图数据。通过逐步构建一个现代化的GNN模型,文章阐明了每个组件的作用和设计背后的动机。最后,文章还提供了一个交互式GNN游乐场,让读者亲身体验GNN模型的构建和预测过程,加深对GNN的理解。
阅读更多
本文总结了作者20年来使用终端程序的经验,归纳出一些并非官方标准但普遍适用的“规则”。这些规则涵盖了程序对Ctrl-C、Ctrl-D、q键的响应,颜色使用,readline键绑定支持,以及管道输出等方面。作者指出,虽然这些规则并非强制性规范,但理解它们有助于预测终端程序的行为,减少学习曲线。文章以实例分析了规则的适用场景和例外情况,并强调了区分程序自身责任与操作系统默认行为的重要性。
阅读更多
本文用一个生动的僵尸围城故事来解释细胞式架构。作者将城市比作一个系统,每个街区作为独立的“细胞”,即使一个街区沦陷,也不会导致整个城市崩溃。这种隔离策略,如同细胞式架构的设计理念,能够有效降低单点故障的影响,保证系统的稳定运行。通过这个例子,文章清晰地阐述了细胞式架构的优势和重要性。
阅读更多
一位博主朋友向作者寻求建议。作者建议:做真实的自己,展现独特的个性和矛盾之处比盲目模仿更有趣;从快速写作开始,比如和朋友聊天一样,再慢慢打磨;先写一些简单的500字短文,例如“我遇到的问题及解决方法”;不断练习,每次改进一点;不要害怕犯错,卡夫卡也经常从头重写;编辑时,删掉最弱的20%;最终,你的博客会吸引和你一样独特的人。
阅读更多
本文深入浅出地讲解了网络协议栈的工作原理,从可靠的数据传输到物理层硬件的细节,展现了其背后惊人的复杂性和精妙之处。文章以一个88.5MB视频下载为例,阐述了IP、TCP、Ethernet等协议如何协同工作,克服网络的不稳定性和数据包丢失等问题,最终实现可靠、高效的数据传输。作者揭示了看似简单的网络操作背后,隐藏着复杂的路由算法、拥塞控制、数据包重组等技术,以及各种协议之间相互依赖和制约的关系,并解释了为何以太网数据包大小设定为1500字节等历史遗留问题。
阅读更多
Quantus是一个先进的量化交易平台,致力于为专业交易员和机构投资者提供高效、可靠的交易解决方案。它整合了强大的数据分析工具、灵活的策略回测功能以及低延迟的交易执行系统,帮助用户更好地把握市场机遇,提升投资收益。Quantus平台以其强大的技术实力和用户友好的界面,正逐渐成为金融科技领域一颗冉冉升起的新星。
阅读更多
arXivLabs是一个框架,允许协作者直接在arXiv网站上开发和共享新的arXiv功能。参与arXivLabs的个人和组织都认同并接受了我们开放、社区、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与坚持这些价值观的合作伙伴合作。如果您有一个能够为arXiv社区增值的项目创意,请了解更多关于arXivLabs的信息。
阅读更多
一位技术专家反思了科技公司将用户视为可操纵的商品的现状。文章批判了以“用户体验”为名的设计,如何通过最小化界面和操纵用户数据来最大化公司利益,最终导致用户体验恶化和数字倦怠。作者提出“杀死用户”的概念,呼吁转向以个人计算、尊严设计、民间软件和小型软件为代表的更以人为本的科技发展模式,最终实现人与技术的和谐共处。
阅读更多