AMD放大!苏妈甩出最强AI芯片叫板老黄,可跑800亿参数大模型
HuggingFace将与AMD工程团队密切合作,优化关键模型,以提供最佳性能,这得益于最新的AMD硬件和软件功能。
【资料图】
AMD放大了!
在周二的发布会上,苏妈直接宣布了最新的一款AI芯片——GPU MI300X,直接叫板英伟达。
AMD本周二表示,将于今年晚些时候开始向部分客户发货。
要知道,Nvidia目前在AI芯片市场中牢牢占据着主导地位。
MI300X
AMD公司的CEO苏妈Lisa Su周二在旧金山发布了一款芯片——GPU MI300X。
据悉,这是该公司AI计算战略的核心。
它能为生成性AI(LLM)提供巨大的内存和数据吞吐量。
Instinct MI300X是之前发布的MI300A的后续产品。该芯片实际上是多个小芯片的组合,这些独立的芯片通过共享内存和网络链接被连接到一个单一的封装中。
苏妈将这款芯片称为生成式AI加速器,其中包含的GPU芯片是专门为AI和HPC(高性能计算)量身打造的。
MI300X是该产品的「纯GPU」版本。MI300A是三个Zen4 CPU芯片与多个GPU芯片的组合。
但在MI300X中,CPU被换成了两个额外的CDNA 3芯片组。
此外,MI300X将晶体管数量从1460亿个增加到1530亿个,共享DRAM内存从MI300A的128千兆字节提升到了192千兆字节,内存带宽从每秒800千兆字节提升到了每秒5.2兆字节。
苏妈在演讲中反复多次强调了这款芯片所具有的非常、非常重要的战略意义。
「因为它能够混合和匹配不同种类的计算,替换CPU或GPU。」
苏马表示,MI300X将提供2.4倍于Nvidia H100 Hopper GPU的内存密度,以及1.6倍的内存带宽。
生成式AI以及LLM的格局已经改变,对更多计算的需求正以指数的形式增长,无论是训练模型还是进行推理。
为了证明对强大计算的需求,苏妈展示了在目前最流行的LLM上工作的部分,即开源的Falcon-40B。
语言模型需要更多的计算,因为它们是用越来越多的所谓的神经网络参数建立的。
她表示,MI300X是AMD第一款功能强大的芯片,可以流畅地在内存中运行大规模的神经网络,而不是必须在外部内存中来回移动数据。
苏妈现场演示了MI300X使用Falcon-40B创建了一首有关旧金山的诗篇。
苏妈表示,「一个MI300X芯片可以在内存中运行高达约800亿个参数的模型。」
「当你将MI300X与竞争对手进行比较时,你就能发现,MI300X提供了2.4倍的内存,和1.6倍的内存带宽,有了所有这些额外的内存容量,我们实际上对LLM是有巨大优势的,因为我们可以直接在内存中运行更大的模型。」
这意味着,对于最大的模型,AMD减少了所需要的GPU数量,大大加快了性能,特别是推理的速度,同时也降低了总成本。
苏妈在演讲中毫不掩饰对这款芯片的喜爱。
AMD Instinct
为了与Nvidia的DGX系统竞争,苏妈发布了一个人工智能计算机系列,即AMD Instinct平台。
这个平台集成了8个MI300X,可提供1.5TB的HBM3内存。
苏妈表示,对于客户来说,他们可以在一个行业标准的平台上使用所有这些AI计算能力的内存,直接放入他们现有的设施。
与MI300X不同的是,现有的MI300A只是一个GPU,它的对手是Nvidia的Grace Hopper组合芯片,它使用Nvidia的Grace CPU和它的Hopper GPU。
Su指出,MI300A正被内置到能源部的劳伦斯-利弗莫尔国家实验室在建的El Capitan超算中。
MI300A目前正作为样品展示给AMD客户,MI300X将在今年第三季度开始向客户提供样品。
苏妈表示,两者都将在第四季度进行批量生产。
和HuggingFace合作
同时,HuggingFace也在今天宣布,AMD已经正式加入其硬件合作伙伴计划。
HuggingFace的CEO Clement Delangue在旧金山举行的AMD数据中心和人工智能技术首发式上发表了主题演讲,以启动这一令人兴奋的新合作。
AMD和Hugging Face合作,意味着将在AMD的CPU和GPU上提供SOTA级别的transformer性能。
该合作对整个Hugging Face社区来说都是个好消息,他们将很快从最新的AMD平台的训练和推理中受益。
在GPU方面,AMD和Hugging Face将首先在企业级Instinct MI2xx和MI3xx系列上合作,然后在客户级Radeon Navi3x系列上合作。
在最初的测试中,AMD最近报告,MI250训练BERT-Large的速度比其竞争对手快1.2倍,训练GPT2-Large快1.4倍。
在CPU方面,两家公司将致力于为客户端Ryzen和服务器EPYC CPU优化推理。
最后,他们的合作将包括性能强大的Alveo V70 AI加速器。
HuggingFace计划支持最先进的自然语言处理、计算机视觉和语音的转化器架构,如BERT、DistilBERT、ROBERTA、Vision Transformer、CLIP和Wav2Vec2。
当然,生成式AI模型也将可用(例如,GPT2、GPT-NeoX、T5、OPT、LLaMA),包括HuggingFace自己的BLOOM和StarCoder模型。
最后,HuggingFace还将支持更多传统的计算机视觉模型,如ResNet和ResNext,以及深度学习推荐模型,这对HuggingFace来说还是头一次。
未来,合作的重点将放在确保对HuggingFace社区最重要的模型能在AMD的平台上开箱即用。
HuggingFace将与AMD工程团队密切合作,优化关键模型,以提供最佳性能,这得益于最新的AMD硬件和软件功能。
HuggingFace将把AMD的ROCm SDK无缝集成到HuggingFace的开源库中,首先是transformer库。
参考资料:
https://www.cnbc.com/2023/06/13/amd-reveals-new-ai-chip-to-challenge-nvidias-dominance.html
https://huggingface.co/blog/huggingface-and-amd
- AMD放大!苏妈甩出最强AI芯片叫板老黄,可跑800亿参数大模型
- 世界观点:每体:哈维期待引进布罗佐维奇,愿用凯西与国米交换
- 柉_关于柉概略
- 表示声音的四字词语_有哪些可以表示声音的四字词语-报道
- 绝世唐门:马小桃的建模曝光,马红俊的后代,身材火辣的小萝莉
- 通讯!第二届中国大运河古镇发展研讨会在杭州临平举行
- 热头条丨令羽
- 定淮门站_关于定淮门站介绍-每日播报
- 全球快看:手机上网太慢如何提高网速_手机上网太慢
- 长春市人社局官网(长春市人事局)-环球头条
- 今日热搜:portmap端口映射_portmap怎么用
- 三星又泄露啦!Galaxy Watch 6旋转表圈将回归 天天即时看
- 竞争对手不是王曼昱,早田希娜和平野美宇,是陈梦奥运会的劲敌
- 世界防治荒漠化与干旱日 | 防沙治沙的“中国智慧”-世界滚动
- 头条焦点:新能源汽车还降价吗?天齐锂业董事长:锂价50万/吨离谱 但3万元/吨回不去
- 双鱼座最喜欢什么星座(双鱼座注定爱哪个星座)|环球快播
- 当前速读:币安与美国SEC达成协议,将所有美国客户的资金和钱包密钥迁回美国境内
- 市值蒸发4000亿,日均订单减少500万,滴滴是网约车司机的首选吗 世界时讯
- 关于月光曲贝多芬的故事(关于月光曲的资料)_今日快讯
- “我们在一起就会了不起” 台青写歌献给两岸青年
- 奋楫争流,拼尽全力——龙舟选手们为两岸的观众献上精彩比赛
- vivo X90s跑分出炉:165万安卓性能天花板!领先20万-焦点讯息
- PickCrafter免费多功能修改器 v1.0 环球动态
- 中国驻柬埔寨使馆驻暹粒领办举办第12次游客安全工作会议 天天热门
- 基金分红:国泰君安1年定开债券发起式基金6月21日分红-天天新资讯
- 今日热搜:政策性“降息”有望带动LPR下调 调降10个基点为购房者减轻的利息压力有限
- 售价144.89万起 新款X5 M/X6 M雷霆版上市 环球关注
- 6月16日基金净值:南方中证1000ETF最新净值2.6771,涨0.86%
- 伍思凯我真的很不错mp3下载_伍思凯我真的很不错 天天速看
- 刘诗雯球拍配置2019(刘诗雯球拍)