Cerebras训练Llama模型超越GPU

2024-10-31

Cerebras Systems公司宣布其WSE-3引擎在运行Meta Platforms最新Llama 3.2模型的推理方面,性能显著提升,速度比8月份测试Llama 3.1模型时提高了3.5倍。这一提升使得Cerebras CS-3系统在本地或Cerebras及其合作伙伴Group 42运营的云中运行时,相比基于Nvidia H100 GPU的实例拥有更大的优势,尤其在价格方面。Cerebras着重强调了Llama 3.2 70B模型的推理性能提升,并表示正在准备推出针对405B参数模型的解决方案。文章还分析了Cerebras与Nvidia在性能和价格方面的对比,指出Cerebras在云端租赁服务的定价策略可能是一种为了抢占市场的亏损策略。

阅读更多
未分类

英特尔复兴之路漫漫:裁员、削减成本、停止分红

2024-08-06

英特尔第二季度财报显示,其营收和运营利润均出现大幅下滑。面对困境,英特尔宣布将裁员15%,并停止向投资者支付股息,以寻求100亿美元的成本缩减。分析认为,尽管英特尔在晶圆代工和芯片设计方面取得了一些进展,但其在数据中心市场份额的损失以及Arm架构的崛起,都为其复兴之路蒙上了阴影。英特尔未来将专注于提高自身晶圆厂的产能,并寄希望于通过推出更具竞争力的产品来扭转局面。

阅读更多
未分类

谁在为 xAI 构建 10 万 GPU 集群?

2024-08-04

埃隆·马斯克旗下的公司,包括 SpaceX、特斯拉、xAI 和 X(前身为推特),都需要大量的 GPU 来支持各自的人工智能或高性能计算项目。由于 GPU 供不应求,马斯克必须优先考虑如何分配有限的资源。xAI 成立于 2023 年 3 月,旨在与 OpenAI、微软、谷歌等公司竞争,打造生成式人工智能。xAI 获得了 64 亿美元的 B 轮融资,并计划在田纳西州孟菲斯建立一个名为“超级工厂”的数据中心,该中心将配备 10 万个 Nvidia H100 GPU。

阅读更多
未分类

拥有1680万核心的图形处理怪兽,你会用来做什么?

2024-07-23

本文探讨了英特尔为美国国防高级研究计划局(DARPA)的HIVE项目开发的一种名为“PIUMA”的大规模并行图形处理器。PIUMA芯片采用定制的RISC指令集,具有针对图形分析优化的独特架构,并通过高速光互连技术连接,可组成拥有1680万个核心和64PB共享内存的超级计算机,用于处理庞大的图形数据。

阅读更多
未分类

英特尔在服务器CPU大战中亮出大招

2024-06-05

本文分析了英特尔发布的最新服务器CPU Xeon 6系列。Xeons 6系列分为两种类型:使用高性能P核心的Granite Rapids和使用高效能E核心的Sierra Forest。Sierra Forest芯片最多拥有144个核心,与之前的Cascade Lake相比,性价比提高了近8倍。预计到2025年,英特尔将推出核心数量高达288个的Sierra Forest芯片。届时,服务器CPU市场竞争将会更加激烈。

阅读更多
未分类

Ampere Readies 256-Core CPU Beast, Awaits The AI Inference Wave

2024-04-20

本文讨论了 Ampere Computing 推出即将推出的 256 核 CPU,该 CPU 旨在满足对人工智能推理不断增长的需求。该处理器预计将提供超过 10 PetaFLOPS 的性能,并采用台积电的 5nm 制程工艺制造。文章深入探讨了该芯片的架构、性能和潜在应用,并提供来自 Ampere Computing 和行业分析师的见解。

阅读更多
未分类