老黄手捧ChatGPT专用「核弹」炸场,英伟达H100至尊版 ...

2023-3-28 20:19| 发布者: fuwanbiao| 查看: 267| 评论: 0

摘要: 新智元报道 编辑:编辑部【新智元导读】GTC大会上,老黄石破天惊地祭出了专为ChatGPT打造的H100 NVLINK,并放出豪言,称英伟达就是行业内的台积电。 英伟达,赢麻了!刚刚终了的GTC大会上,靠着满屏的「生成式AI」, ...


新智元报道


编辑:编辑部


【新智元导读】GTC大会上,老黄石破天惊地祭出了专为ChatGPT打造的H100 NVLINK,并放出豪言,称英伟达就是行业内的台积电。


英伟达,赢麻了!


刚刚终了的GTC大会上,靠着满屏的「生成式AI」,手握一块支撑ChatGPT算力、提速10倍的H100 NVLINK芯片,老黄就差把这几个字写在脸上——「我是赢家」。


ChatGPT,Microsoft 365, Azure,Stable Diffusion,DALL-E,Midjourney……一切这些时下最红最爆的AI产品,英伟达全都能从中分得一杯羹。


今年初ChatGPT在全球的爆火,让英伟达股价飙升,市值直接增加700多亿美圆。目前,英伟达市值为6400亿美圆。


而往常,AI的iPhone时辰曾经到来,第四次科技反动就要开启,而手握A100和H100的英伟达,或成最大赢家。


在GTC大会上,老黄宣布了英伟达在GPU、加速库、计算光刻、云平台上的亮眼进步,更是放出豪言——英伟达就是要做AI圈的台积电!


往常曾经有人猜测,今天的演讲都是在H100上用AIGC模型生成的。


ChatGPT专用GPU已来


这次大会上最重磅的发布,就是针对ChatGPT打造的NVIDIA H100 NVLINK。


由于算力需求庞大,针对ChatGPT等LLM的推理,英伟达推出了新款Hopper GPU,配备双GPU NVLINK的PCIE H100,具有94B内存。


事实上,深度学习的历史从2012年之后,就不时与英伟达息息相关。


老黄表示,2012年深度学习元老Hinton和学生Alex Kerchevsky、Ilya Suskever在锻炼 AlexNet时,用的 正是GeForce GTX 580。


随后, AlexNet一举夺得ImageNet图像分类竞赛冠军,成为了深度学习大爆炸的奇点。


而时隔10年,在OpenAI的Ilya Suskever也是用着英伟达的DGX,锻炼出了ChatGPT背地的GPT3,及GPT3.5。


老黄自豪地说,目前在云上独一能够实践处置ChatGPT的GPU,就是HGX A100。


但与A100相比,一台搭载四对H100和双GPU NVLINK的效劳器速度还要快上10倍!由于H100能够将LLM的处置成本降低一个数量级。


随着生成式AI掀起一波机遇浪潮,AI正处于转机点,使得推理工作负载呈阶梯函数式增长。


在以前,设计一个云数据中心来处置生成式AI,是庞大的应战。


一方面,理想状况下最好运用一种加速器,使数据中心具有弹性;但另一方面,没有一个加速器能以最优的方式处置在算法、模型、数据类型和大小方面的多样性。英伟达的One Architecture平台就兼具加速功用和弹性。


而今天,英伟达宣布,推出全新的推理平台。每种配置都对某类工作负载中止了优化。


好比针对AI视频工作负载,英伟达就推出了L4,在视频解码和转码、视频内容审核、视频通话功用上做了优化。


而一台8-GPU L4效劳器,将取代一百多台用于处置AI视频的双插槽CPU效劳器。


同时,英伟达还针对Omniverse、图形渲染以及文本转图像/视频等生成式AI推出了L40。其性能是英伟达最受欢送的云推理GPU T4的10倍。


当前,Runway推出的Gen-1,以及Gen-2生成式AI模型具有的强大才干便是借助了英伟达的GPU。


另外,英伟达还推出了全新的超级芯片Grace-Hopper,适用于引荐系统和向量数据库。


应战芯片极限破,计算光刻提速40倍


在芯片范畴,英伟达分离台积电、ASML和Synopsys,历时4年终于完成了计算光刻技术的一项严重突破——NVIDIA cuLitho计算光刻库。


在抵达2nm制程的极限后,光刻就是突破点。


计算光刻模仿了光经过光学元件后与光刻胶相互作用时的行为,经过应用逆物理算法,我们能够预测掩膜板上的图案,以便在晶圆上生成最终图案。


在芯片设计和制造范畴中,计算光刻是最大的计算工作负载,每年都要耗费数百亿CPU小时。相比之下,英伟达发明的这个新算法,能够让日益复杂的计算光刻工作流程能够在GPU上并行执行。


总结来说,cuLitho不只能使计算速度提升40倍,而且功耗也能够降低9倍之多。


举个例子,英伟达的H100需求89块掩膜板。


假如用CPU中止处置的话,每个掩膜板都需求耗费两周的时间。而假如在GPU上运转cuLitho,则只需8个小时即可处置完一个掩膜板。


而台积电也能够用500个DGX H100系统中的4,000个Hopper GPU,完成之前需求多达40,000台基于CPU的效劳器才干搞定的工作,并且功率也会从35MW降至5MW。


值得留意的是,cuLitho加速库与Ampere和Volta架构的GPU也是兼容的,不外Hopper是最快的处置计划。


老黄表示,由于光刻技术曾经处于物理学的极限,晶圆厂能够进步产量,为2nm及以后的展开做好准备。


AI的iPhone时辰


这几个月,ChatGPT以摧枯拉朽之势,眼看就要掀起第四次科技反动。「我们正处于AI的iPhone时辰」这个说法,也随之普遍传播开。


在GTC大会上,老黄也是激动地把这句话重复了三遍。


iPhone时辰来临,初创公司如OpenAI在竞相构建推翻性的产品和商业方式,而谷歌、微软这样的老牌公司,则在寻求着应对之法。


它们的种种举措,都是由生成式AI在全球引发的制定AI战略的紧迫感。


英伟达加速计算始于DGX AI超级计算机,这也是当前大型言语模型完成突破的背地引擎。


GTC上,老黄自豪地表示,是我亲手将全球首款DGX交给了OpenAI。


从那之后,「财富」100强企业中,其中有一半都装置了DGXAI超级计算机。


DGX配有8个H100 GPU模组,同时H100配有Transformer引擎,能够处置ChatGPT这样令人惊叹的模型。


8个H100模组经过NVLINK Switch彼此相连,完成了全面无阻塞通讯。8个H100协同工作,就像是一个巨型的GPU。


让老黄倍感激动的是,微软宣布Azure将向其H100 AI超级计算机开放私人预览版。


并称,「DGX超计算机是现代AI工厂。我们正处于AI的iPhone时辰。」



一手带出ChatGPT


过去十年,加速和纵向扩展分离使各种应用完成百万倍性能提升。


令人印象最深化的例子,便是2012年,AlexNet深度学习框架的提出。


当时,Alex Krizhevsky、Ilya Suskever,以及Hinton在GeForce GTX 580上运用了1400万张图完成了锻炼,可处置262千万亿次浮点运算。


十年后,Transformer面世。


Ilya Suskever锻炼了GPT-3来预测下一个单词,需求中止的浮点运算比锻炼AlexNet模型要多一百万倍。


由此,发明出了令全世界震惊的AI——ChatGPT。


用老黄的一句话总结:


这意味着崭新的计算平台曾经降生,AI的「iPhone时辰」曾经到来。加速计算和AI技术曾经走进理想。


加速库是加速计算的中心。这些加速库衔接了各种应用,进而再衔接到各行各业,构成了网络中的网络。


经过30年的开发,目前曾经有数千款应用被英伟达的库加速,简直触及科学和工业的每个范畴。


目前,一切的英伟达GPU都兼容CUDA。


现有的300个加速库和400个AI模型掩盖了量子计算、数据处置、机器学习等普遍的范畴。


这次GTC大会,英伟达宣布更新了其中的100个。


英伟达Quantum平台由库和系统组成,可供研讨人员推进量子编程模型、系统架构和算法。


cuQuantum是用于量子电路仿真的加速库,其中IBM、百度等公司曾经将这一加速库集成到他们的仿真框架中。


Open Quantum CUDA是英伟达的混合GPU-Quantum编程模型。


英伟达还宣布推出一个量子控制链路,这是与Quantum Machines协作开发的。它能够将英伟达GPU衔接到量子计算机,以极快的速度中止纠错。


还有RAFT新库推出,用于加速索引、数据加载和近邻搜索。


此外,英伟达还宣布了DGX Quantum,用DGX构建,并应用最新开源的CUDA Quantum,这个新平台为从事量子计算的研讨人员提供了一个反动性的高性能和低延迟的架构。


英伟达还推出了NVIDIA Triton Management Service软件,可在整个数据中心自动扩展和编排Triton推理实例。适用于像GPT-3大言语模型的多GPU、多节点推理。


用于计算机视觉的CV-CUDA和用于视频处置的VPF是英伟达新的云范围加速库。


老黄宣布CV-CUDA Beta优化了预处置和后处置,完成了更高的云吞吐量,将成本和能耗减少了四分之一。


目前,微软处置视觉搜索、Runway为其生成式AI视频处置过程,全都采用了CV-CUDA和VRF库。


此外,英伟达加速计算还辅佐基因组学完成了里程碑式展开。运用英伟达助力的仪器设备,将整个基因组测序的成本降低至100美圆,成为另一个里程碑。


英伟达NVIDIA Parabrics加速库可用于云端或仪器设备内的端到端基因组剖析,并且适用于各种公有云和基因组学平台。


ChatGPT在跑,英伟达在赚


往常,ChatGPT、Stable Diffusion、DALL-E和Midjourney,曾经唤醒了全世界关于生成式AI的认知。


当红炸子鸡ChatGPT仅在推出2个月后,就月活破亿,曾经成为史上用户增长最快的应用。


能够说,它就是一台计算机。不只能生成文本、写诗、改写研讨论文、处置数学问题、以至还能编程。


众多突破性成果培育了今天的生成式AI。


Transformer能够以大范围并行的方式,从数据的关系和依赖性中学习上下文和含义。这使得LLMs能够应用海量数据中止学习,在没有明白锻炼的状况下执行下游任务。


另外,受物理学启示的扩散模型,能够经过无监视学习来生成图像。


老黄总结道,短短十几年,我们就从辨认猫,逾越到了生成在月球行走的太空服猫的过程。


往常完整能够说,生成式AI就是一种新的计算机,一种能够用人类言语中止编程的计算机。


此前,命令计算机处置问题,是独属于程序员的特权,但是往常,人人都能够是程序员了。


和比尔盖茨一样,老黄也下了相似的定义:生成式AI是一种新型计算平台,与PC、互联网、移动设备和云相似。


经过Debuild,我们只需说分明自己想要什么,就能够直接设计和部署Web应用。


很明显,生成式AI将简直重塑一切行业。


要做AI界的「台积电」


在这样的背景下,专业公司都需求运用自己的专有数据,来构建定制模型。


接着,老黄自豪宣布,行业需求一个相似台积电的代工厂,来构建自定义的大言语模型,而英伟达,就是这个「台积电」!


大会上,英伟达宣布推出NVIDIA AI Foundations云效劳,让客户能够定制LLM和生成式AI。


这个云效劳包含言语、视觉和生物学模型制造效劳。


其中,Nemo用于构建定制的言语文本转文本生成式模型。


而Picasso是视觉言语模型制造,能够用于锻炼自定义模型,包含图像、视频和3D应用。


只需向Picasso发送文本提示和元数据的API调用,Picasso就会用DGX Cloud上的模型把生成的素材发送回应用。


更凶猛的中央是,把这些素材导入NVIDIA Omniverse,就能够构建真切的元宇宙应用,和数字孪生仿真。


另外,英伟达还在和Shutterstock协作,开发Edify-3D生成式模型。


同时,英伟达和Adobe的协作也继续扩展,把生成式AI融入营销人员和创意人士的日常工作流,并且,特别留意关于艺术家版权的维护。


第三个范畴,就是生物学。


往常,药物研发行业的价值曾经抵达近2万亿元,研发投入高达2500亿美圆。


NVIDIA Clara就是一款医疗健康应用框架,用于影像、仪器、基因组学剖析和药物研发。


而最近,生物圈的抢手方向是应用生成式AI发现疾病靶因、设计新分子或蛋白类药物等。


与之相应的,BIONEMO能够让用户运用专有数据创建、微调、提供自定义模型,包含AlphaFold、ESMFold、OpenFold等蛋白质预测模型。


最后,老黄总结道,NVIDIA AI Foundations是一个云效劳和代工厂,用于构建自定义言语模型和生成式AI。


老黄云效劳,月租36999美圆


英伟达这次,还推出了一款云效劳。


它敏锐地看到客户需求更简单快捷访问NVIDIA AI的需求,因而推出了NVIDIA DGX Cloud。


DGX Cloud与Microsoft Azure、Google GCP和Oracle OCI都有协作。只需一个阅读器,NVIDIA DGX AI超级计算机,就能即时接入每家公司!


在这款云上,能够运转NVIDIA AI Enterprise加速库套件,直接处置AI端到端的开发和部署。


并且,云上不止提供NVIDIA AI,还有全球最主要的几大云效劳商。


而英伟达的第一个NVIDIA DGX Cloud,就是Oracle Cloud Infrastructure(OCI)。


在OCI中,NVIDIA CX-7和BlueField-3两个王炸合体,立马组合出一台强力超算。


据引见,企业往常能够租用DGX Cloud,月租36999美圆起。


最后,当然还是每年GTC大会的保存节目——Omniverse。老黄宣布了关于元宇宙平台Omniverse更新。


往常,Microsoft和NVIDIA,正准备将Omniverse带给数以亿计的Microsoft 365和Azure用户。


此外,还有音讯称:老黄为了能让H100合规地出口中国,便照着之前A800的阅历特调了一款「H800」,将芯片之间的数据传输率降到了H100的50%左右。


总结来说,老黄在 的大会曾经相当明白,英伟达要做AI范畴的台积电,像晶圆厂一样提供代工,在此基础上让行业内其他公司锻炼算法。


这种商业方式,能胜利吗?


参考资料:


https://www.NVIDIA.com/gtc/keynote/



路过

雷人

握手

鲜花

鸡蛋
版权声明:免责声明:文章信息来源于网络以及网友投稿,本网站只负责对文章进行整理、排版、编辑,是出于传递 更多信息之目的, 并不意味着赞同其观点或证实其内容的真实性,如本站文章和转稿涉及版权等问题,请作者在及时联系本站,我们会尽快处理。
已有 0 人参与

会员评论

 万奢网手机版

官网微博:万奢网服务平台

今日头条二维码 1 微信公众号二维码 1 抖音小程序二维码 1
上海万湖珠宝贸易有限公司 地址:上海市宝山区共和新路4727号新陆国际大厦1003-1007室 网站经营许可证 备案号:沪ICP备11005343号-12012-2019
万奢网主要专注于手表回收,二手名表回收/销售业务,可免费鉴定(手表真假),评估手表回收价格,正规手表回收公司,宝山实体店,支持全国范围上门回收手表
返回顶部