网络内容消失:政府、新闻和其他网页上的链接失效和数字衰变
皮尤研究中心的一项新分析表明,网络内容转瞬即逝:2013 年至 2023 年间存在的网页中,截至 2023 年 10 月,有四分之一已无法访问。对于较旧的内容,这一趋势更加明显。2013 年存在的网页中,约有 38% 在今天已不可用。研究发现,23% 的新闻网页和 21% 的政府网站网页至少包含一个失效链接。54% 的维基百科页面在其“参考文献”部分至少包含一个指向已不存在页面的链接。
阅读更多
皮尤研究中心的一项新分析表明,网络内容转瞬即逝:2013 年至 2023 年间存在的网页中,截至 2023 年 10 月,有四分之一已无法访问。对于较旧的内容,这一趋势更加明显。2013 年存在的网页中,约有 38% 在今天已不可用。研究发现,23% 的新闻网页和 21% 的政府网站网页至少包含一个失效链接。54% 的维基百科页面在其“参考文献”部分至少包含一个指向已不存在页面的链接。
阅读更多
文章探讨了大型语言模型(LLM)如何改变软件的生产和使用方式。作者认为,LLM将使普通人能够开发小型软件工具,并修改现有软件,从而实现最终用户编程的愿景。文章重点讨论了聊天机器人作为交互模式的局限性,并提出了“计算媒介”的概念,即用户可以直接学习和塑造的开放式计算环境,LLM作为其中的合作者。作者还展望了LLM如何支持可扩展和可组合的GUI应用程序,使用户能够根据自己的需求定制软件。
阅读更多
Gio 是一个用于在 Go 中编写跨平台立即模式 GUI 的库。它支持所有主要平台,包括 Linux、macOS、Windows、Android、iOS 以及 WebAssembly。Gio 依赖性极小,只依赖于平台库来进行窗口管理、输入和 GPU 绘图。它包含一个基于 Pathfinder 项目的高效矢量渲染器,并在 OpenGL ES 和 Direct3D 11 上实现。
阅读更多
Sierra Space 公司的“追梦者”航天器即将进行首次轨道飞行,向国际空间站运送物资。作为 NASA 商业补给服务计划的一部分,追梦者将成为最新访问国际空间站的商业飞行器。追梦者采用升力体设计,可在跑道上降落,并能快速将研究成果送回科学家手中。除了运送货物外,Sierra Space 还计划将其用于载人航天、国际合作任务以及国防领域,例如快速向全球各地运送物资。
阅读更多
东京地方法院驳回了美国工程师关于人工智能发明创造的诉讼请求,称专利法中规定的发明者仅限于自然人。法院指出,专利法中有条款以专利申请人是自然人为前提。鉴于许多其他国家对将人工智能视为发明者持谨慎态度,法院得出结论,发明者仅限于自然人。法院没有对该发明的实质内容是否符合专利要求作出判断,但同时提到,如果承认人工智能生成的 inventions,有可能设计一个不同于现有专利法的独立体系。
阅读更多
美国联邦调查局(FBI)联合国际执法机构于5月15日再次查封了臭名昭著的网络犯罪论坛BreachForums。该论坛曾多次被用于买卖被盗数据和黑客工具。去年,FBI逮捕了该论坛的管理员Conor Brian Fitzpatrick,并查封了该网站。但之后,一位名为Baphomet的用户接管并重建了该论坛。此次查封行动中,FBI还控制了该论坛的官方Telegram频道以及Baphomet的个人频道。
阅读更多
truemetrics,一家致力于帮助物流公司改善最后一公里配送体验的初创公司,正在招募一名Python开发人员。该职位要求具备强大的后端、AWS和数据技能,负责开发、改进、部署和维护用于传感器和地理数据的算法和数据处理管道。该公司提供具有竞争力的薪酬和股权,以及在快速发展的公司中担任关键角色的机会。
阅读更多
本文讲述了作者作为一名经验丰富的开发人员,如何巧妙地阻止了CTO将项目外包给一家承包公司。作者通过精心设计测试任务,揭露了承包公司团队能力不足的真相,最终成功地保护了自己的团队。
阅读更多
NetBSD项目宣布禁止在其代码库中使用由AI工具(如GitHub Copilot、ChatGPT和Code Llama)生成的代码。该项目认为,这些工具生成的代码可能存在版权问题,因此除非得到核心团队的明确许可,否则不得将其添加到NetBSD中。
阅读更多
本文探讨了如何使用Unsloth微调LLaMA-3 8B模型,以进行金融情感分析。文章详细介绍了构建自定义数据集、使用Unsloth笔记本微调模型以及评估模型性能的步骤。作者比较了不同微调模型的性能,包括推理速度、情感得分方差和平均置信度,并讨论了LLaMA 3 8B量化方面的争议。文章还提供了对结果的分析,并为希望使用Unsloth微调模型进行情感分析的读者提供了指导。
阅读更多
牛津大学物理系的国际研究团队利用X射线数据验证了爱因斯坦关于黑洞的一个重要预测,首次观察到黑洞周围存在一个“坠落区”,物质不再绕黑洞旋转,而是直接坠入其中。该研究还发现,这个区域存在着银河系中已知的最强引力。
阅读更多
Zoraxy 是一款简单易用的反向代理服务器,具有直观的重定向规则和区域服务黑名单功能。它集成了 ZeroTier 控制器,可轻松管理网络节点,并提供实时流量数据分析工具。Zoraxy 是一个开源项目,用户可以通过插件自定义路由规则。
阅读更多
本文介绍了如何使用完全开源的技术栈,从零开始在裸机上构建 AWS S3 的克隆版本。该项目旨在构建一个功能类似于 AWS S3 的存储平台,包括自动桶部署、动态扩展卷、安全性等。作者详细介绍了构建过程中的各个方面,包括控制台、节点、源代码控制、K3s 集群部署、自动化桶部署、API、前端以及网络配置等。
阅读更多
OpenAI联合创始人兼首席科学家Ilya Sutskever和超级对齐团队负责人Jan Leike的辞职引发了热议。尤其引人注目的是,OpenAI前员工都对离职原因三缄其口。原因在于,OpenAI的离职协议中包含极其严格的保密和非贬低条款,禁止他们在余生批评前雇主,否则将失去所有股权。这与OpenAI最初标榜的透明和负责任的形象相矛盾,也引发了外界对其安全承诺的质疑。
阅读更多
本文介绍了如何使用Bytewax和Proton实时分析Hacker News数据。Bytewax用于构建自定义输入连接器,从Hacker News API获取最新数据,并进行数据处理和转换。Proton则用于实时分析和可视化数据,通过SQL查询创建物化视图和Grafana仪表板,展示趋势帖子和活跃评论者等信息。
阅读更多
文章分析了OpenAI进军搜索市场的原因,指出这是由于谷歌和Meta在消费者和企业市场对OpenAI构成的双重压力。谷歌计划在其所有产品中加入大型语言模型功能,这将使“ChatGPT体验”商品化,并抢占OpenAI的“AI关注度”。Meta致力于构建开源 Llama 生态系统,为企业提供了OpenAI的私人替代方案。谷歌和Meta都证明了他们可以免费提供GPT-4级别的LLM,这降低了OpenAI的长期定价权。因此,OpenAI需要在搜索市场获得可观的市场份额,以证明其估值和预期。文章认为,生成式AI游戏已经完全转向免费和广告支持模式,迫使OpenAI参与搜索竞争以保持相关性。
阅读更多
Experts.js 是一个简化 OpenAI Assistants API 使用的框架,它可以轻松创建和部署 OpenAI Assistants,并将它们链接在一起作为工具,以创建具有扩展内存和细节关注能力的先进多 AI 代理系统。Experts.js 引入了 Assistants 作为工具的概念,每个工具都是一个 LLM 支持的助手,可以代表其父助手或工具承担专门角色或完成复杂任务,从而实现复杂的编排工作流或精心设计的一系列紧密结合的任务。
阅读更多
这篇博文介绍了MIT 6.8301 计算机视觉课程的期末项目,该项目创建了一个动画二维码,可以以高达 2 mbps 的速度传输数据。该项目被命名为“SWANTV”,但作者更喜欢“Epilepsend”,因为它更准确地描述了项目的本质:以 30 FPS 的速度闪烁巨大且色彩鲜艳的网格,类似于一个巨大的彩色动画二维码。
阅读更多
西部数据推出了一系列基于2.5英寸硬盘的6TB外置硬盘,这是该硬盘规格七年来首次出现新的容量点。然而,这款硬盘速度慢,而且不太可能适用于任何移动PC,因此它似乎将专门用于便携式和专用存储产品。西部数据没有透露其6TB My Passport,Black P10和G-Drive ArmorATD外置硬盘是否依赖叠瓦式磁记录(SMR),但我们猜测我们正在处理SMR硬盘。它们的读取性能和增加的厚度表明制造商添加了另一个具有与低容量硬盘相似面密度的盘片,这可能进一步证明我们正在处理SMR。也就是说,在重新写入此类硬盘上的数据时,预计性能会特别低。
阅读更多
美国参议院一份最新报告指出,价格高昂的减肥药可能会使美国医疗体系不堪重负。如果美国有一半的肥胖成年人开始服用 Wegovy 等新型减肥药,每年的总成本预计将达到 4110 亿美元,超过了 2022 年美国人在所有处方药上的总支出。尽管这些药物对整体健康有显著益处,但价格过高,无法完全抵消医疗保健使用量的节省。报告建议制药商将美国药价降至与其他国家相同的水平,以避免美国人失去获得这些药物的机会或承担更高的医疗保健费用。
阅读更多
Wine 9.9版本已在GitLab平台发布,该版本更新了PE可执行文件加载器,修复了WoW64注册表项重定向问题,并提升了打印机驱动程序的兼容性等。
阅读更多
OpenAI与Reddit签署了一项协议,将获取Reddit数据API的实时内容,这意味着OpenAI可以在ChatGPT和其他新产品中呈现Reddit网站上的讨论内容。该协议还将“使Reddit能够为Reddit用户和版主带来新的AI驱动功能”,并使用OpenAI的大语言模型来构建应用程序。OpenAI也已注册成为Reddit的广告合作伙伴。
阅读更多
美国证券交易委员会(SEC)修订了S-P法规,要求某些金融机构在发现数据泄露事件后30天内向受影响的个人披露事件。新修正案要求受影响的金融机构在敏感信息被未经授权访问或使用时,在30天内通知受影响的个人,详细说明事件、泄露的数据和采取的保护措施。该修正案还要求金融机构制定、实施和维护事件响应计划的书面政策和程序,以检测、响应和恢复未经授权访问或使用客户信息的行为。
阅读更多
法国政府近日在其海外属地新喀里多尼亚封禁了TikTok,这是欧盟范围内首次出现此类举措。封禁的起因是新喀里多尼亚近期发生暴力抗议活动,抗议活动由一项新的选举法引起,该法案将允许在新喀里多尼亚居住10年的公民参加地方选举。法国政府未详细说明封禁TikTok的理由,但表示此举旨在阻止抗议者利用该应用程序组织集会和抗议活动。数字权利组织和人权活动人士对此表示担忧,认为此举开创了一个危险的先例,可能会助长全球范围内政府任意封禁网络平台的行为。
阅读更多
Wuffs是一种内存安全的编程语言,用于安全地处理不可信文件格式,包括解析、解码和编码图像、音频、视频、字体和压缩档案等文件格式。它非常快,可以比其他库更快地解码bzip2、deflate、GIF和PNG。Wuffs的目标是生成与Go或Rust一样安全,但与C一样快的软件库。
阅读更多
ILGPU是一个用于高性能GPU程序的JIT编译器,可以用.Net语言编写。它完全由C#编写,没有任何原生依赖项。它既提供了C++ AMP的灵活性和便利性,又提供了Cuda程序的高性能。内核范围内的函数不需要注解(默认的C#函数),并且允许对值类型进行操作。所有内核(包括所有硬件特性,如共享内存和原子操作)都可以在CPU上使用集成的多线程CPU加速器执行和调试。
阅读更多
Chrome 开发者工具新功能 Gemini 可帮助开发者更好地理解控制台中的错误和警告信息。该功能通过人工智能分析控制台消息、堆栈跟踪、相关源代码和网络标头,生成详细的解释。用户需要满足特定条件才能使用此功能,包括使用 Chrome 125 或更高版本、登录 Google 帐户、选择英语(美国)设置以及启用“使用 AI 理解控制台消息”。
阅读更多
Delta模拟器的标志因与Adobe的标志过于相似而遭到Adobe的法律威胁。Adobe认为Delta程式化字母“D”与其程式化字母“A”过于相似。Delta的开发者Riley Testut表示,为了避免混淆,Delta将更新其标志。目前App Store和AltStore上的图标只是一个临时图标,最终的更新标志将在Delta 1.6版本中发布。
阅读更多