• 新闻中心
  • 为什么期待英特尔Xe架构GPU? 云南电脑批发

为什么期待英特尔Xe架构GPU? 云南电脑批发 发布日期:2019-12-20

 中国it商城          云南卓兴电脑批发平台            云南卓兴电脑商城

【导言】据中国信息通信研究院的数据,我国IDC(Internet Data Center)行业保持每年32%的增长率,截至2018年底,中国已是全球超大规模数据中心数量第二多的国家,占比全球8%,仅次于美国,但快速增长的背后却存在着诸多问题,比如服务器利用率低、能耗过高等等,那么面向2020年,有哪些创新的技术或产品可以为这个行业带来变革?

上月在美国SC现场,英特尔高级副总裁、首席架构师以及架构、图形与软件部门总经理Raja Koduri将在下午的主会场演讲上发布期待已久的产品——Xe架构GPU。

我为什么期待英特尔Xe架构GPU?

熟悉芯片行业发展的人或许对Raja Koduri的名字不陌生,在加入英特尔之前他是AMD RTG部门主管、首席GPU架构师,也是GPU业界公认的大牛。虽然AMD的GPU业务显然没有老对手NVIDIA做得那么好,但是作为业界唯二的GPU公司主要负责人,我对于Raja Koduri带领下的部门也充满了期待。

如此说来,Xe就是一款饱受期待的产品。虽然在此之前,英特尔也一直是GPU领域出货量最大的品牌(是的,我说的就是核芯显卡),但是这并非指独立GPU市场。或者我们换个角度来说,在独立GPU市场,英特尔的品牌影响力近乎于零。

二十年前事尽空,半随波浪半随风

当然,这并不代表着英特尔没有进行过独立显卡(独立GPU)的尝试。早在1998 年,英特尔就携手Real3D公司推出过一款型号为i740的显卡 ,其核心频率达80MHz,显存主频为100MHz(SGRAM显存),显存容量为8MB,像素填充率为55MPixels/s,具备64Bit图形核心,同时支持DVD解压和平行资讯处理、精准像素描插补等特性。

我为什么期待英特尔Xe架构GPU?

因为3D性能出色,这款显卡很是风靡过一段时间,也受到不少玩家的喜爱。不过好事多磨,没过多久Real3D就宣布倒闭,并被卖给了英特尔公司。树倒猢狲散,Real3D的员工也各奔前程,除了部分被英特尔吸收之外,另一部分员工也加入了当年叱咤风云的ATI,后者如今已经被AMD收购。

并购了Real3D的英特尔也同样有自己的独立显卡梦,并一度宣布过一项名为“Larrabee”的项目。按照规划,Larrabee将会是英特尔第一款实用级万亿次运算图形处理器,但悲催的是这项计划在酝酿数年之后,却在2009年底被英特尔最终放弃,有消息表示放弃的原因就是产品的性能以及驱动的开发远远落后于原先的计划。

一次次的失败,让英特尔变得越来越现实,也将目光从独立显卡转移到集成显卡上来。2010年,英特尔早AMD一步在第一代酷睿处理器(Westmere)上实现了CPU和GPU的首次融合——将名为“HD Graphics”的GPU图形核心跟CPU核心封装在同一块基板上。

我为什么期待英特尔Xe架构GPU?

至此,这种将GPU从北桥芯片组转移到处理器基板和CPU做邻居的整合方式,也宣告集显时代(主板集成)终结,核显时代(CPU集成)来临的历史时刻。为了向过去的集成显卡告别,英特尔也将全新的HD Graphics命名为“核芯显卡”。

十年旧梦无寻处,几度新春不在家

10年前,英特尔放弃独立显卡,转向核芯显卡,从而奠定了GPU市场的累计销量第一的地位。

但是英特尔也并非没有在独立计算领域付诸努力。2013年,英特尔推出了一款众核架构的产品——至强融核协处理器Xeon Phi。这款产品某种程度上脱胎于之前夭折的Larrabee,但不同之处在于Xeon Phi并没提供任何的图形输出能力,它的用途只能是加速计算,对标产品就是NVIDIA的Tesla系列。

我为什么期待英特尔Xe架构GPU?

第一代Xeon Phi研发代号为Knights Corner,采用22nm工艺制造,单颗芯片集成50多个IA架构处理核心。随后,英特尔还推出了第二代采用14nm工艺的至强融核Knights Landing,这款产品有处理器和协处理器两种形态,尤其是作为处理器形态的小尾巴让人印象深刻。不过考虑到这个时代NVIDIA Tesla加速卡的如日中天和英特尔在计算加速领域陷入的被动局面,就不难理解为什么Knights Landing的设计脑洞如此之大。

我为什么期待英特尔Xe架构GPU?

作为处理器领域的霸主,英特尔进军加速卡领域的举措无疑是正确的,但是Xeon Phi显然不能承担起这个重任。虽然在英特尔最初的设想中,Xeon Phi与至强处理器都采用了x86架构,算是同种同源,但如果考虑到2009年NVIDIA就开始布局CUDA生态系统,并且从2009年到2013年恰恰是异构计算突飞猛进发展的时间,尤其是2012年采用Fermi架构的Tesla加速卡助力Titan超算拿到了世界冠军的桂冠,你就能明白英特尔当时的心情是有多么急迫,对于Xeon Phi的期望有多大。

我为什么期待英特尔Xe架构GPU?

自2013年上市开始,英特尔至强融合协处理器在中国市场开始生根发芽,几乎在任何HPC相关的场景中你都能够看到它的身影。终于,在经过了重重努力和运作之下,国家超级计算中心广州中心的天河二号超级计算机就采用了至强处理器+至强融核协处理器的组合,并且在2013年6月一举拿下世界超算排行的冠军。从而一发不可收,从2013年6月到2015年6月,天河二号连续7次荣膺世界冠军,也为至强融核协处理器赚足了眼球。

但是眼球并不代表行业的认可。在代表HPC风向的TOP500超级计算机榜单排名中,至强融核协处理器自上榜之日起就处于弱势地位,相比之下它所对标的NVIDIA Tesla份额却在年年扩大。在这样的情况下,英特尔宣布叫停原本计划推出的第三代至强融核Knights Mill的产品,外媒也用“Intel Quietly Kills Off Xeon Phi”为题表达了对Xeon Phi的惋惜。或许Knights Mill这个名字本身就让人有些唏嘘,不由得想起了冲向风车磨坊的唐吉坷德。

从i740到Xeon Phi,英特尔用10年的时间证明了一个道理,欲速则不达。

江东子弟多才俊,卷土重来未可知

10年后,英特尔再度发力,准备将独立GPU也同样纳入怀中。特别是对于企业级市场来说,GPU所代表的含义并非图形,而是计算。美国时间11月17日下午4点,在科罗拉多州丹佛会议中心,Raja Koduri发布了英特尔新一代Xe架构的GPU,这也意味着英特尔在经过了20年的挣扎之后,终于开始走上了独立GPU的道路。

我为什么期待英特尔Xe架构GPU?

具体说来,这次英特尔发布的Xe GPU并非是一款产品,而是一个架构,一个能够应用于高性能计算、深度学习与训练、云服务、多媒体编辑、工作站、游戏、轻薄笔记本、便携设备等等场景的计算架构。在这个问题上,你可以理解为英特尔提供了一种集GeForce、Quadro和Tesla于一体的产品,其实本质上这些设备也无非就是提供了计算能力而已。

我为什么期待英特尔Xe架构GPU?

那么,在英特尔看来,Xe GPU是如何来区分的呢?其实暗中另有乾坤。按照应用场景,Xe GPU也被划分成了三个系列(但与NVIDIA的定位不同)——

Xe LP低功耗系列——用于集成核显、入门级独显,典型功耗5-20W,最高可扩展到50W。

Xe HP高性能系列——用于主流和发烧消费市场、数据中心和AI领域,典型功耗75-250W。

Xe HPC高性能计算系列——用于超级计算机等,功耗暂无具体数值但基本不会有什么限制。

我为什么期待英特尔Xe架构GPU?

作为最高端产品,HPC级Xe的最大特性就是可以扩展到上千个执行单元(thousands)。这里,每个执行单元都进行了升级,提供40倍的双精度浮点计算能力。Xe HPC架构还将包括一个非常大的统一缓存,称为Rambo缓存,它可以将多个GPU连接在一起。

我为什么期待英特尔Xe架构GPU?

另外值得一提的是,未来的Xe架构的GPU将采用7nm工艺制造,称之为Ponte Vecchio。要说经过台积电的先期科普,许多人都知道了7nm架构对于处理器的价值,包括英特尔的“老朋友”AMD也一直在强调目前基于架构工艺的领先性。这一次Xe架构采用了7nm,也说明英特尔对7nm的量产也有信心(虽然现在更“成熟”的10nm产品还依然很少)。另外相对台积电工艺,大家对于英特尔的7nm也是充满了期待。

我为什么期待英特尔Xe架构GPU?

还需要顺便一句的就是英特尔在X架构内部采用的名为Xe-link的互连技术,当然目前这种技术基于CXL标准(即Compute Express Link) 。有了这些技术的加持,英特尔面向百亿亿次计算的信心就更足了,而在解决了传统GPU应用的短板之后,英特尔似乎已经满足了硬件层面HPC应用的所有要求,计算、加速、存储、网络应有尽有。

如果你爱一个女孩子十分却能表达出一分,倒不如你爱她一分,却能表达出十分——孟京辉《恋爱的犀牛》

不过在HPC领域,硬件性能固然重要,但是也并非起到决定性的作用,因为软件和应用的优化才是重头戏。俗话说“好马配好鞍,好车配风帆”(风帆请把广告费付一下),有了强大的硬件平台之后,英特尔更希望实现上层软件和应用的统一化,为此它特别推出了一款名为oneAPI的软件计划,也在这次大会上一起发布了。

即从巴峡穿巫峡,便下襄阳向洛阳

从2000多年前秦始皇“书同文、车同轨”开始,“统一”的观念就已经深入中国人的骨子里,而在HPC应用的这一问题上,我们也同样需要有统一的行业标准和平台。“统一”的好处是不言而喻的,特别是对于开发者来说,大家采用同样的接口标准或者编程平台,那么在后续的软件优化与延续性方面来说都会事半功倍。

我为什么期待英特尔Xe架构GPU?

会上,Raja Koduri特别提到了oneAPI计划的目标,就是开放、简单扩展和无人掉队。对于最后这点,Raja Koduri尤其强调了它的困难性(hardest),但是也正是这一点,才能够使得所有的开发者站在同样的起跑线上,也让针对HPC应用的软件和应用程序能够有据可循。

我为什么期待英特尔Xe架构GPU?

按照构想,oneAPI是一个以开发者为中心的平台,将为AI应用无处不在、多架构并存的世界重新定义一种新的编程方式。oneAPI提供一个通用、开放的编程体验,让开发者可以自由选择架构,无需在性能上作出妥协,也大大降低了使用不同的代码库、编程语言、编程工具和工作流程所带来的复杂性。oneAPI保留了现有软件投资,包括支持现有语言,同时为开发人员创造更多丰富的应用程序提供了灵活性。说白了,就是不管你的底层硬件是什么,通过oneAPI系统都可以针对硬件实现优化,智能的优化,针对不同的应用调用最好的资源,让应用变得更好。

我为什么期待英特尔Xe架构GPU?

与此同时,Raja Koduri也宣布了oneAPI测试版项目已正式上线,有兴趣的小伙伴可以去英特尔软件官网看看(稍后可以注册),这样就可以在云端实现开发环境的体验了。不过针对这个测试版,我之前听过有英特尔的朋友谈到这个问题,毕竟oneAPI作为行业标准还在萌芽状态,率先推出测试版的主要作用就是加强开发者之前的沟通与试错。计划在经过一年左右的磨合期之后,英特尔将会推出正式版。

我为什么期待英特尔Xe架构GPU?

讲完了硬件,讲完了软件和应用平台,就在大家以为演讲即将结束的时候,Raja Koduri突然“放大招”,邀请了美国阿贡实验室的专家Rick Stevens来分析美国第一台E级超算平台Aurora的相关细节。按公开资料,Aurora是美国能源部定制的一款百亿亿次超级计算机,也是第一台采用英特尔架构的百亿亿次超级计算机,英特尔将所有未来的顶级技术都应用于该平台。

我为什么期待英特尔Xe架构GPU?

按照计划,Aurora的计算节点架构将由两个10纳米英特尔至强可扩展处理器(代号Sapphire Rapids的产品,不知道什么时候上市)和六个Ponte Vecchio GPU(还是不知道什么时候上市)共同组成。该系统同时还将支持超过10PB的内存和超过230PB的存储容量,并能通过Cray Slingshot技术(更不知道什么时候上市)连接超过200个机架的节点。三个“不知道”,为这套超级计算机增添了不少神秘色彩,也说明了英特尔包括美国的倾尽全力。

既然美国如此,中国是否也有类似的产品呢?答案是肯定的。其实早在多年前,中国就开始了百亿亿次E级超算原型机的研发,并且确定了三种技术路线。如今,三大路线的原型机都已经通过验收,甚至许多设计理念已经付诸商用(我还参观过其中一台)。应该说,在百亿亿次的问题上,包括美国、中国、欧洲、日本等许多国家和地区都已经行动起来,而且所有人核心原则都是四个字“自主可控”。这也可以看出超级计算机在未来科技竞争中的龙头地位,所谓“兵家必争”。

不畏浮云遮望眼,只缘身在最高层

说了这么说,“不忘初心”的回顾一下题主的问题,说的是2020年最期待的数据中心技术或者产品。说到数据中心这个话题,我相信知乎上包括网络上一大部分小伙伴都是不清楚的,大家更熟悉的是酷睿处理器、熟悉的是GeForce显卡,熟悉的是某个游戏或者某个视频。

数据中心是一个很特殊的领域,虽然看起来服务器本质上与PC电脑并没什么不同,但实际上PC因为只面对个人用户,所以只要性能够、速度快就能玩得爽,但是数据中心设备要求的维度更多,性能只是其中的一个方面。除此之外,稳定性与可靠性、上层软件与应用、对应的软硬件生态系统,这些都是使用者需要关注的问题。而相对这些,性能反而并不是主要因素。

我为什么期待英特尔Xe架构GPU?

之所以提到这个问题,就是因为在我看来英特尔Xe架构的GPU所代表的性能并非是绝对重要的,而是它补齐了英特尔这只木桶一直欠缺的、尝试几次却都以失败告终的最后一块短板。如果,我是说如果,英特尔能够在与NVIDIA的竞争中补齐最后这一点点差距的话,哪怕是占据当下10-20%的市场份额(当然包括Raja Koduri在内的英特尔高管预期比这个高得多),以英特尔的体量和整个生态的能力,就可以成为数据中心领域绝对意义上的霸主(虽然现在也差不多了)。

为什么我会如此确定以及肯定呢?就是因为在Xe架构GPU之后,英特尔就成为了业界唯一一家能够提供CPU、GPU、FPGA、AI芯片的全能型公司,并且能够为这些芯片适配相应的软件、应用环境和整个生态,而后者恰恰是包括NVIDIA和AMD在内所欠缺的。相比之下,NVIDIA侧重于GPU和AI芯片环境,而AMD则是在CPU、GPU上更强一些。但是无论如何,它们在整体解决方案能力上都与英特尔存在着巨大的差距,而这种差距是多年来一代代产品的积累,是除去硬件之外的软件与生态的经营,并不是一朝一夕所能实现的。

这就是数据中心市场与个人消费类市场最大的不同。在英特尔加入之后,GPU市场的竞争将会更加热闹,相对来说这个市场的主要玩家就从一家变成了两家(消费级市场或许有三家)。

感谢AMD的出色表现,让我们买到更超值的英特尔处理器;同样也感谢英特尔,让NVIDIA在不久之后对Tesla的价格进行不小的让步和妥协。

我期待2020年,我更期待这一天的早日到来。

 

来源于 今日头条 IT大嘴巴

分享到: 0