高阶公司:计算的并行未来
高阶公司推出了一种名为Bend的并行编程语言,旨在简化多核CPU/GPU的并行编程。Bend语言基于HVM并行运行时,该运行时源于Yves Lafont在1997年提出的交互组合器并发计算模型。HVM编译器和评估器能够自动实现近乎理想的加速,最高可达1000多个线程。Bend语言使用户无需深入了解C/CUDA等底层技术,即可轻松编写并行代码,其体验类似于Python,并且能够自动处理并发编程中的复杂问题,例如锁、互斥体和原子操作等。
阅读更多
高阶公司推出了一种名为Bend的并行编程语言,旨在简化多核CPU/GPU的并行编程。Bend语言基于HVM并行运行时,该运行时源于Yves Lafont在1997年提出的交互组合器并发计算模型。HVM编译器和评估器能够自动实现近乎理想的加速,最高可达1000多个线程。Bend语言使用户无需深入了解C/CUDA等底层技术,即可轻松编写并行代码,其体验类似于Python,并且能够自动处理并发编程中的复杂问题,例如锁、互斥体和原子操作等。
阅读更多
这篇文章介绍了阿拉蒂·普拉巴卡尔,拜登政府的科学和技术顾问。文章讨论了普拉巴卡尔的研究背景、她作为顾问的角色以及她对科学和技术在社会中的作用的看法。
阅读更多
这篇文章回顾了19世纪美国语法学家如何使用句子结构图来分析和理解英语语法。从James Brown的括号法到Frederick A. P. Barnard的象形符号,再到Stephen Watkins Clark的气球图和Alonzo Reed与Brainerd Kellog的线条图,这些先驱们试图将句子的内在逻辑和结构可视化。他们将语法视为一门可以教授和学习的科学,并相信通过分析句子的组成部分,学生可以更好地理解语言的运作方式。
阅读更多
本文研究了 Transformer 是否可以学习对参数知识进行隐式推理。研究发现 Transformer 可以通过“顿悟”,即长时间训练以克服过拟合,来学习隐式推理。然而,不同推理类型的泛化水平有所不同。分析表明,“顿悟”背后的机制与泛化电路的形成及其与记忆电路的相对效率有关。研究还发现,GPT-4-Turbo 和 Gemini-1.5-Pro 等基于非参数记忆的模型在复杂推理任务中表现不佳,而完全“顿悟”的 Transformer 可以实现近乎完美的准确性。
阅读更多
大型语言模型在实际应用部署中,面临着巨大的内存消耗瓶颈,其中,Transformer架构中注意力机制的键值(KV)缓存消耗了大量内存。本文提出一种新型层压缩KV缓存方法,仅计算和缓存少量层的KV,显著节省内存消耗并提升推理吞吐量。实验证明,该方法在大型语言模型上实现了高达26倍的吞吐量提升,并在语言建模和下游任务中取得了具有竞争力的性能。
阅读更多
Daylight Computer 推出了一款名为 DC-1 的 60fps 类纸平板电脑,主打护眼功能。它采用 Live Paper 显示屏,具有无蓝光、无频闪、哑光纸感等特点,即使长时间使用也感觉舒适。DC-1 还搭载了专为减少干扰而设计的 Sol:OS 操作系统,并提供舒适的阅读和笔记体验。
阅读更多
Waymo One 自动驾驶网约车服务在美国凤凰城的服务范围扩展了 90 平方英里,使服务总面积达到 315 平方英里,成为美国最大的自动驾驶服务区域。此次扩张将服务范围扩展到凤凰城北部、斯科茨代尔和梅萨市中心,为居民和游客提供前往热门目的地、度假村、高尔夫球场和娱乐场所的便利交通。Waymo 还与盐河皮马-马里科帕印第安人社区合作,首次在部落土地上提供自动驾驶服务。此外,Waymo 还致力于改善用户体验,包括提供个性化音频体验、重新设计车载屏幕以及推出“共享行程”功能等。
阅读更多
这本《统计推断和回归用户指南》旨在帮助读者理解统计推断和回归的基本方法,并将其应用于社会科学研究。该书分为两部分,第一部分介绍了统计推断的基本原理,包括基于设计的推断、基于模型的推断、渐进性和假设检验。第二部分重点介绍了回归分析,包括线性回归、最小二乘法的机制和统计特性。
阅读更多
作者回顾了自己使用GitHub Copilot一年的体验,尽管Copilot在生成样板代码等方面有一定帮助,但他最终认为Copilot并没有提高他的生产力。原因是Copilot的不可预测性和速度缓慢,导致作者需要花费大量时间等待和修改代码,最终效率反而降低。作者认为,如果Copilot能够更智能、更快速,或许才能真正提高生产力。
阅读更多
Pragtical是一款轻量级、功能强大且可高度扩展的代码编辑器,它仅占用极少的内存和磁盘空间,同时提供语法高亮、多光标、命令面板等实用功能。Pragtical支持通过Lua和C API进行扩展,并提供跨平台支持,可在Windows、Linux和macOS上运行。
阅读更多
本文介绍了作者如何为个人RSS阅读器feedi添加Kindle集成功能。作者详细描述了使用Python从网站提取文章内容、将其打包成EPUB文件以及通过电子邮件发送到Kindle设备的过程,并分享了过程中遇到的挑战和解决方案。
阅读更多
马来西亚法律与体制改革部长表示,将于10月份向国会提交互联网“终止开关”立法。该法案旨在加强数字安全,要求社交媒体平台和互联网信息服务提供商对其产品在网络犯罪中的作用承担更多责任。此外,马来西亚还将制定法规,对网络欺凌进行分类和定义,并采取执法措施。
阅读更多
本文介绍了加密通讯软件Signal在其十周年之际,总裁Meredith Whittaker强调Signal作为非营利组织,不追踪用户、不投放广告,并为工程师提供优渥待遇的运营模式,以此证明科技行业不依赖于监控资本主义也能取得成功。Whittaker认为Signal的成功模式可以作为其他科技公司效仿的模板,并呼吁建立一个更加多元化的科技生态系统。
阅读更多
本文介绍了一种名为MCT自优化的算法(MCTSr),该算法将大型语言模型(LLM)与蒙特卡洛树搜索(MCTS)相结合,旨在提高复杂数学推理任务的性能。针对LLM在准确性和可靠性方面的挑战,特别是在策略性和数学推理方面,MCTSr利用系统探索和启发式自优化机制来改进LLM内的决策框架。该算法通过选择、自优化、自我评估和反向传播的迭代过程构建蒙特卡洛搜索树,并利用改进的上置信界(UCB)公式来优化探索-利用平衡。大量实验表明,MCTSr在解决奥林匹克级别的数学问题方面非常有效,显著提高了多个数据集的成功率,包括GSM8K、GSM Hard、MATH,以及奥林匹克级别的基准测试,包括Math Odyssey、AIME和OlympiadBench。
阅读更多
乔姆斯基-许岑贝格尔枚举定理是诺姆·乔姆斯基和马塞尔-保罗·许岑贝格尔推导出的关于由明确的上下文无关文法生成的给定长度的单词数量的定理。该定理提供了形式语言理论和抽象代数之间的一个意想不到的联系。该定理指出,如果一种语言可由明确的上下文无关文法生成,那么描述该语言中具有给定长度的单词数量的生成函数是满足特定多项式方程的代数函数。
阅读更多
本文逆向分析了 Xilinx 的 XC2064,解释了其内部电路以及“位流”如何对其进行编程。XC2064 是第一款 FPGA 芯片,它包含 64 个逻辑块,远少于现代 FPGA 中的数千或数百万个。文章详细介绍了 FPGA 的基本结构、可配置逻辑块(CLB)、查找表(LUT)、互连网络、8 针交换矩阵、配置内存、位流加载过程以及晶体管在 FPGA 中的作用。
阅读更多
牛津大学衍生公司Oxford PV近日宣布,其串联太阳能电池板在美国首次实现商业销售,该电池板与标准硅电池板相比,发电量提高了20%。这款72片电池板采用了Oxford PV专有的钙钛矿硅太阳能电池技术,将被一家未透露姓名的美国客户用于公用事业规模的装置。这些电池板的模块效率高达24.5%,降低了度电成本(LCOE),并且由于它们在相同面积上产生的电力更多,因此土地利用效率更高。
阅读更多
本文介绍了abliteration技术,该技术可以去除大型语言模型(LLM)的审查机制,使其能够响应所有类型的提示。文章详细介绍了abliteration技术的原理和实现步骤,并通过实验验证了其效果。实验结果表明,abliteration技术能够有效去除LLM模型的审查机制,但也可能导致模型性能下降。为了解决这个问题,文章建议使用DPO等技术对abliterated模型进行微调,以恢复其性能。
阅读更多
文章讨论了是否应该辍学创业的问题。作者以自身经历为例,认为上大学并非总是好的或坏的,最重要的是要不断学习。虽然作者最终选择了辍学创业并取得了成功,但他认为这并非适用于所有人,并强调了持续学习的重要性。
阅读更多
美国国家安全局将于 9 月 5 日推出名为“No Such Podcast”的播客节目,旨在揭开这个曾经高度机密机构的神秘面纱。该节目将邀请高级领导、新员工等各级 NSA 员工分享他们的工作经历,并探讨网络安全、人工智能和前沿研究等话题。首期节目将解密 NSA 在追捕本·拉登行动中的信号情报贡献。
阅读更多
该网页提供了一个 Linux 内核系统调用表的查询工具,用户可以根据架构和内核版本筛选查看系统调用的详细信息,包括调用号、名称、符号、定义位置和版权信息。
阅读更多
CatLock 是一款 Windows 平台的实用工具,旨在防止猫咪意外踩踏键盘输入。它可以通过热键(Ctrl + L)锁定键盘,并显示半透明覆盖层提示键盘已锁定。用户可以通过点击覆盖层解锁键盘,并通过系统托盘菜单调整透明度、启用/禁用锁定通知等设置。
阅读更多
Perl和Raku大会(现已进入第26个年头)正在招募赞助商,大会将于2024年6月24日至28日在内华达州拉斯维加斯举行。赞助商将获得在演讲者背景横幅、活动网站、材料分发等方面的展示机会。大会提供早餐、零食和咖啡休息时间的赞助选项,赞助费用从2500美元到3500美元不等。
阅读更多
本文讲述了作者在南极工作期间,由于卫星网络带宽极其有限,导致互联网速度缓慢,网页加载异常困难的经历。作者详细描述了南极互联网的局限性,包括高延迟、低带宽、频繁掉线等问题,并以多个应用程序为例,阐述了应用程序开发者在设计产品时,忽略网络环境差异带来的糟糕用户体验。作者呼吁开发者关注弱网环境下的用户体验,优化应用程序,提高其在低带宽、高延迟环境下的可靠性和可用性。
阅读更多
据分析师郭明錤透露,苹果公司计划在2026年推出一款配备可折叠显示屏的全屏M5 MacBook。这款MacBook预计将采用18.8英寸或20.3英寸的折叠屏,并搭载M5系列芯片。由于面板和铰链成本高昂,预计起售价将远超现有MacBook产品线,可能与Vision Pro接近。
阅读更多
本文介绍了如何在苹果自研芯片Mac上进行ARM64汇编编程。文章以《64位ARM汇编语言编程》一书为基础,针对苹果的ARM64平台调整了所有示例代码,涵盖了从基础知识到高级主题的各个方面,包括CPU寄存器、汇编器语法、系统调用、内存管理、函数和堆栈、NEON协处理器以及代码优化等。
阅读更多
Neovim 0.10 历经漫长的开发周期,带来了大量新功能和一些重大变化。文章重点介绍了默认颜色方案、LSP和诊断映射、内置注释、终端UI增强、LSP嵌入提示以及Tree-sitter查询编辑器等方面的改进。新版本默认启用了同步输出、系统剪贴板同步、超链接、自动真彩色检测等功能,提升了用户体验。此外,文章还展望了未来发展方向,包括改进LSP和Tree-sitter体验、内置代码片段和自动补全支持,以及Tree-sitter解析器分发等方面的改进。
阅读更多
Lima 是一款类似于 WSL2 的工具,可以启动支持自动文件共享和端口转发的 Linux 虚拟机。它使用简单,易于上手,并且受到 CNCF 的支持。
阅读更多