AMD公司因发现首批锐龙9000处理器存在问题,决定将该系列处理器发布日期推迟至8月。6核和8核的Ryzen 9600X和9700X将于8月8日发布,而12核和16核的Ryzen 9900X和9950X将于8月15日发布。AMD公司表示,推迟发布是为了确保为用户提供高质量的使用体验,并将对首批处理器进行替换。
MINT-1T是一个开源的多模态交错数据集,包含一万亿个文本词符和34亿张图片,规模比现有开源数据集扩大10倍。该数据集还包括PDF、ArXiv论文等全新来源,并发布了所有子集,包括HTML数据、PDF数据和ArXiv数据。
社交媒体平台X(前Twitter)悄悄地将其水枪表情符号重新设计回枪支。这一变化与2016年到2018年间,其他主要平台将枪支表情符号转换为水枪的趋势背道而驰。X平台表示,这并非最终设计,未来还会进行修改。
7月19日,CrowdStrike Falcon传感器配置更新出现逻辑错误,导致全球大量Windows系统崩溃。Bitsight分析发现,在此之前,7月16日CrowdStrike服务器流量出现异常波动,随后 egress 流量显著下降。Bitsight认为这两起事件之间可能存在关联,并将持续展开调查。
本文探讨了如何以构造性的方式构建空间填充曲线,特别是 Hilbert 曲线。作者首先解释了经典 Hilbert 曲线的构造,并指出了其在构造证明中的问题所在。为了解决这个问题,作者提出了广义 Hilbert 曲线,并证明了在依赖选择公理下,这种曲线是满射的。此外,作者还解释了为什么在没有选择公理的情况下,无法在层拓扑中构造空间填充曲线。
文章探讨了在AI时代,像Figma这样的矢量化设计工具是否会变得尴尬。作者认为,能够直接编写代码的设计师越来越倾向于跳过Figma阶段,而AI工具目前主要集中在生成代码或高保真原型上,忽略了设计过程中重要的UX思考阶段。作者建议AI工具应该专注于将低保真线框图转换为代码,并认为像Balsamiq这样的线框图工具在未来可能会更加重要。
本文概述了苹果公司 Siri 与听写功能的数据收集与使用方式。 当你使用 Siri 和听写功能时,苹果会收集并存储你的语音输入、设备信息、位置信息等数据,用于改进服务质量。 苹果公司强调,这些数据与你的 Apple ID 无关,不会用于构建营销档案或出售给第三方。 你可以随时关闭 Siri 与听写功能,或选择不与 iCloud 同步数据。
本文探讨了以Meta为代表的科技巨头开源大型语言模型的原因,指出免费提供人工智能的背后是将人工智能算力资源商品化的商业策略。文章分析了Meta开源Llama模型的动机,认为Meta希望通过免费提供模型,推动用户生成内容,提升平台参与度,最终有利于其广告收入。此外,文章还探讨了人工智能基础设施建设的规模化效应,认为这将推动机器人、自动驾驶等领域的突破。
本文揭露了GitHub存在的数据安全风险:任何人均可访问已删除和私有仓库数据。文章分析了三种常见场景,包括从已删除分支获取数据、访问已删除仓库数据以及获取私有仓库数据,并指出这些问题源于GitHub的仓库网络架构设计。即使删除了仓库或分支,提交的数据也不会被真正删除,只要有一个分支存在,这些数据就永远存在。文章强调了密钥轮换对于保护敏感数据的重要性,并建议用户提高安全意识,警惕GitHub数据泄露风险。
本文探讨了在 Windows 环境下进行开发的多种方案,包括使用原生 Windows 工具、MinGW-w64、Cygwin 以及 WSL(Windows Subsystem for Linux)。文章详细比较了它们的优缺点,例如 WSL 提供完整的 Linux 体验但硬件访问受限,Cygwin 提供 Linux 兼容性但 ABI 差异可能导致问题,MinGW-w64 则能生成原生 Windows 可执行文件但 ABI 也不同于 MSVC。作者还推荐了 MSYS2 作为整合 Cygwin 和 MinGW-w64 的解决方案,并根据自身经验分享了使用 WSL2 和原生 Windows 开发的体会。
美国政府警告本国的科技初创公司和风险投资公司,一些外国投资可能是敌对国家寻求获取数据和技术,以服务于其政府或削弱美国企业的幌子。这些机构强调,外国行为者,尤其是与中国政府有关联的行为者,可能会利用复杂的投资结构来掩盖其最终目的,从而规避美国外国投资委员会(CFIUS)的审查。
本文回顾了事务处理的演变历史,特别是Jim Gray提出的“DebitCredit”基准测试对行业的影响。文章指出,传统数据库在处理高并发事务时存在局限性,主要是因为行锁和网络往返时间导致的延迟。TigerBeetle数据库通过将“debit/credit”作为基本操作单元,并优化网络交互,实现了更高的交易处理性能,同时提升了安全性。
文章介绍了一种通过绑定挂载隐藏 Linux 进程的技术。该技术利用 Linux 系统中 /proc 目录下的进程信息,将一个正常进程的 /proc/PID 目录绑定挂载到目标进程的 /proc/PID 目录上,从而达到隐藏目标进程的目的。文章还提供了一种检测这种隐藏技术的方法,并通过一个简单的脚本实现了该方法的自动化。
T-Mobile与投资公司KKR成立合资企业,收购光纤服务提供商Metronet。Metronet为美国17个州的300多个社区和200多万户家庭提供服务。此次收购包括Metronet的宽带基础设施、住宅光纤业务运营和现有客户。T-Mobile计划投资近49亿美元收购该合资企业50%的股权,以及Metronet 100%的住宅光纤零售业务和客户。
ICANN向.top域名注册局发出警告,要求其在2024年8月中旬前改善对网络钓鱼报告的处理和对滥用域名的暂停机制,否则将吊销其域名销售许可证。.top域名在过去一年中成为网络钓鱼网站最常用的后缀,仅次于.com域名。研究显示,.top域名中超过4%的网站是网络钓鱼网站,数量超过11.7万个。ICANN的警告信中指责.top域名注册局未能及时、全面、合理地调查和处理有关DNS滥用的报告。
这篇文章是关于生物电路设计的文档,内容涵盖了从基因表达速率的设计原则到细胞信号放大、噪声基因表达和细胞模式形成等多个方面。它还包括了使用Python进行科学计算的介绍、数学和计算方法的技术附录以及使用Gillespie算法进行随机模拟的内容。
这篇文章探讨了人工智能发展中的“模型崩溃”问题,即由于缺乏多样化的人类数据,人工智能模型的性能受到限制。文章指出,模型过度依赖现有数据,导致其难以理解和应对新的、未见过的情况,从而阻碍了人工智能的进一步发展。
2024年7月19日,CrowdStrike发布的Falcon传感器内容配置更新导致部分Windows系统崩溃。问题出在快速响应内容更新中一个未检测到的错误,该错误导致内存读取越界并引发异常,最终导致系统崩溃。CrowdStrike承诺改进快速响应内容的测试、部署和监控,并为客户提供更多控制权,以防止类似事件再次发生。
本文介绍了一种名为 MAIA 的多模态自动化可解释性代理系统。MAIA 利用神经模型来自动执行神经模型理解任务,例如特征解释和故障模式发现。它为预训练的视觉语言模型配备了一套工具,支持对其他模型的子组件进行迭代实验,以解释其行为。这些工具通常由人类可解释性研究人员使用,用于合成和编辑输入、从现实世界的数据集中计算最大激活样本,以及总结和描述实验结果。MAIA 提出的可解释性实验组合了这些工具来描述和解释系统行为。
FranzAI 是一款免费的智能电子邮件助手,利用先进的 AI 技术简化您的电子邮件工作流程。它可以自动回复邮件、设置提醒、管理任务列表,并提供多种语言的邮件翻译功能。FranzAI 使用最新的 GPT-4o 技术,并提供免费和付费版本。免费版提供有限的 AI 回复次数和其他功能,而付费版将提供更多功能,例如无限的邮件回复、邮件转发、附件处理等。
Mistral AI 发布了新一代旗舰模型 Mistral Large 2,该模型在代码生成、数学和推理方面比其前身功能更强大,并提供更强大的多语言支持和高级函数调用功能。Mistral Large 2 拥有 128k 的上下文窗口,支持包括中文在内的数十种语言以及 80 多种编码语言。该模型在 MMLU 上的准确度达到了 84.0%,并在代码生成、推理和多语言支持方面进行了 significant 的改进。
这篇论文提出了一种新方法来识别管理者对团队绩效的因果贡献,该方法需要反复将管理者随机分配到多个团队,并控制个人的技能。研究发现,优秀的管理者对团队绩效的影响大约是优秀员工的两倍。自荐担任管理者的人比通过抽签任命的管理者表现更差,部分原因是自荐的管理者过于自信,尤其是对自己的社交技能。管理绩效可以通过经济决策技能和流体智力来预测,但与性别、年龄或种族无关。根据技能而非人口统计或领导偏好来选择管理者可以大大提高组织生产力。
麻省理工学院计算机科学与人工智能实验室的研究人员开发了一种名为“MAIA”的多模式自动化可解释性代理系统,该系统可以使用视觉语言模型来自动执行各种神经网络可解释性任务。MAIA可以通过生成假设、设计实验来测试假设,并通过迭代分析改进其理解,从而解释人工智能模型的内部机制,帮助我们了解人工智能模型如何运作,并 audit 其安全性和偏差。
文章探讨了如何微调大型语言模型 Llama 3 以用于客服领域。文章首先解释了什么是微调以及微调的优势,例如提高特定任务的性能、定制模型以及降低成本。然后,文章详细介绍了微调 Llama 3 的步骤,包括安装必要的库、下载预训练模型、准备微调数据集、设置超参数、建立评估指标以及最终进行微调。此外,文章还提到了微调过程中可能遇到的常见问题,例如灾难性遗忘、过拟合和数据获取困难等。最后,文章介绍了 Symbl.ai 的 Nebula LLM,该模型专门针对人类互动进行了微调,非常适合客服场景。
本文以图文方式解释了企业常用的身份验证协议 SAML(安全断言标记语言),介绍了 SAML 的工作原理、参与者(身份提供者、服务提供者和用户)以及 SP 发起的登录流程。文章详细解释了从用户访问服务提供者网站、重定向到身份提供者进行身份验证,到最后成功登录服务提供者网站的整个流程,并解释了 AuthnRequest、SAML Assertion 等关键概念。
InteractiVenn是一个基于网络的工具,用于通过韦恩图分析数据集。它允许用户通过列表或树形结构输入数据,并以交互方式探索集合之间的关系。该工具还提供了一些自定义选项,例如字体大小、颜色不透明度和图表导出。
本文介绍了深度学习中的基本概念和算法,特别是多层感知器(MLP),并以图像纹理表示为例,详细解释了神经网络的结构、训练过程、反向传播算法等。此外,文章还探讨了输入编码、Adam优化器等改进网络性能的方法,并简要介绍了自动编码器和卷积网络等高级主题。
文章强调“公开学习”的重要性,鼓励学习者通过博客、教程、演讲等方式分享学习过程,并积极参与技术社区互动。作者认为,公开学习不仅能帮助他人,更能促进自身成长,并有机会获得来自行业专家的指导和帮助,最终实现个人价值的提升。
本文介绍了如何使用现代 CSS 样式来设计美观且易于理解的 HTML 表格。文章详细讲解了表格元素、默认样式、设计注意事项以及使用 CSS 进行样式化的技巧,包括文本对齐、标题和页脚样式、边框和背景颜色、表格标题位置、溢出管理、粘性行和列、垂直对齐以及列大小调整等方面。文章还提供了示例代码和演示,帮助读者更好地理解和应用这些技术。