英特尔架构日放大招:Xe显卡/Alder Lake/Tiger Lake等一大波新品来袭

百家 作者:芯智讯 2020-08-14 12:39:27

当地时间8月13日,英特尔在2020年架构日活动上,除了推出全新的SuperFin晶体管技术、“混合结合”(Hybrid Bonding)封装技术之外,还发布了第二代混合架构的x86处理器Alder Lake,解析了Xe显卡架构,揭秘了Tiger Lake、Ice Lake、Sapphire Rapids的更多细节,进一步展示了英特尔在其六大技术支柱方面的持续创新。


第二代混合x86处理器Alder Lake发布


众所周知,SoC上的big-LITTLE大核 小核的设计是由Arm最先推出,该设计主要是为了实现性能与功耗上的平衡,目前采用这种大小核设计的SoC已经广泛被应用到了移动手机当中。随后,英特尔也推出了全新的大小核设计的处理器,不同的是英特尔是通过3D封装的形式来实现。


在CES2019展前发布会上,英特尔就正式发布了基于英特尔混合CPU架构和“Foveros”3D封装技术的全新SoC平台“Lakefield”,其内部集成一个Sunny Cove架构的大核心、四个Tremont架构的小核心,但都不支持超线程,同时集成4MB末级缓存和第11代核显等。


需要指出的是,Lakefied内部的部分模块所采用的制程工艺也是不同的,比如CPU核心、GPU核心所在的计算层采用的是10nm工艺,IO部分所在的基底层则是22nm工艺,封装面积仅为12mm×12mm。


通过这样的混搭设计(包括工艺和大小核),也使得Lakefield能效提升了24%%,待机功耗降低了91%,网页性能提升了33%。


不过,Lakefiled主要用于低功耗设备,包括平板、2合1电脑之类的便携产品。


而在此次的2020架构日活动上,英特尔正式推出的第二代混合x86处理器Alder Lake,其则是针对客户端计算的产品,有消息称其被视为十二代酷睿处理器。


Alder Lake采用了全新的Golden Cove大核心和Gracemont小核心架构。其中Golden Cove是英特尔最近几年CPU路线图中的第三款产品,而Golden Cove的提升重点在于ST单核性能,还有AI性能,同时提升安全,支持更先进的网络,包括5G等等。而小核心Gracemont自然重点在于低功耗,当然相比前代也会提升ST单核性能,并提升矢量性能。



根据英特尔公布的官方路线图上的时间表,基于10nm工艺单Alder Lake预计会在2021年上市。


Xe图形架构解析


早在2018年6月,英特尔就曾在分析师大会上证实,将进军独立显示芯片(Discrete GPU)市场,挑战 Nvidia 与AMD。今年的CES 2020上,英特尔首次向公众展示了基于Xe架构的独立显卡“Xe DG1”,并展示了“Xe DG1”在笔记本电脑上运行FPS大作《命运2》的试玩影像。随后,网上也陆续爆出了Xe的更多细节。

在今年4月“智存高远·IN擎未来”的2020英特尔中国媒体纷享会,英特尔正式公布了基于全新Xe架构的两款产品:一款是之前曝光的独立显卡DG1,另一款则是针对HPC市场的通用GPU产品——PONTE VECCHIO。



据介绍,英特尔Xe架构是一个非常灵活、扩展性极强的统一架构,针对性地划分成多个微架构。它可用于几乎所有计算、图形领域,包括百亿亿次高性能计算、深度学习与训练、云服务、多媒体编辑、工作站、游戏、轻薄笔记本、便携设备等。

而在此次的架构日活动上,英特尔则详细介绍了经过优化的Xe-LP(低功耗)微架构和Xe-HPG(高性能)架构。


据介绍,Xe-LP是英特尔针对PC和移动计算平台的最高效GPU架构,最高配置EU单元多达96组,相比Ice Lake增多了一半,同时拥有3.8MB大容量的三级缓存,还提升了内存和架构效率以获得更高带宽。Xe-LP还具有新架构设计,包括异步计算、视图实例化 (view instancing)、采样器反馈(sampler feedback)、带有AV1的更新版媒体引擎以及更新版显示引擎等。这将使新的终端用户功能具备即时游戏调整(Instant Game Tuning)、捕捉与流媒体及图像锐化。在软件优化方面,Xe-LP将通过新的DX11路径和优化的编译器对驱动进行改进。


目前,英特尔首款基于Xe-LP微架构针对PC的独立图形显卡DG1已投产,并有望按计划于2020年开始交付。DG1现在已可在英特尔DevCloud上供早期访问用户使用。


根据此前的信息显示,英特尔针对PC市场的Xe独立显卡DG1,拥有96组EU执行单元,一共是768个核心,基础频率1GHz,加速频率1.5GHz,1MB二级缓存以及3GB显存,TDP为25W。预计DG1的性能与GTX950相当,比GTX 1050则差了15%左右,总体定位不高,适合高能效领域,尤其是笔记本GPU。


值得一提的是,英特尔新推出的针对移动市场的Tiger Lake也集成全新设计Xe LP低功耗版本。


除了Xe LP版本之外,英特尔还将推出针对高性能市场的Xe-HP芯片。据介绍, Xe-HP是业界首个多区块(multi-tiled)、高度可扩展的高性能架构,可提供数据中心级、机架级媒体性能,GPU可扩展性和AI优化。它涵盖了从一个区块(tile)到两个和四个区块的动态范围的计算,其功能类似于多核GPU。


据介绍,首款Xe-HP芯片已于实验室完成启动测试。而在此次架构日活动中,英特尔展示了Xe-HP在单个区块上以60 FPS的速率对10个完整的高质量4K视频流进行转码。另一个演示还展示了Xe-HP在多个区块上的计算可扩展性。英特尔现在正在与关键客户一起测试Xe-HP,并计划通过Intel® DevCloud使开发者可以使用Xe HP。


英特尔还推出了新的Xe微架构变体——Xe-HPG,这是一种针对游戏优化的微架构,结合了Xe-LP的良好的效能功耗比的构建模块,利用Xe-HP的可扩展性对Xe-HPC进行更强的配置和计算频率的优化。同时,Xe-HPG添加了基于GDDR6的新内存子系统以提高性价比,且将具有加速的光线跟踪支持。


英特尔表示,Xe HP和Xe-HPG预计将于2021年开始发货。


此外,针对数据中心市场,英特尔推出了基于Xe架构的Server GPU(SG1),其通过聚合4个DG1独立显卡来实现的,可以通过很小的尺寸将性能提升至数据中心级别,以实现低延迟、高密度的安卓云游戏和视频流。SG1将很快投产,并于今年晚些时候发货。


最后,英特尔显卡指挥中心(IGCC)还引入了新功能,包括即时游戏调整和游戏锐化:即时游戏调整是一个专用于游戏的驱动,可以比以前更快地推送修复和优化给最终用户,而且不需要下载和安装完整的驱动程序。它只需要用户在每个游戏选择加入一次即可;游戏锐化使用感知自适应锐化,一种基于计算着色器的自适应锐化算法提高游戏中的图像清晰度。此功能对于使用分辨率缩放以平衡性能和图像质量的游戏尤其有用,并且是IGCC中的一项可选功能。

10nm Tiger Lake

在今年年初的CES大会上,英特尔正式宣布了代号为Tiger Lake的新一代移动酷睿处理器。根据当时公布的信息显示,其将采用增强版的10nm工艺,并采用全新的CPU架构,同时集成英特尔自己的Xe GPU架构,并大幅提升对AI支持。此外,英特尔并未公布更多细节。而在此次的2020架构日活动上,随着全新SuperFin晶体管技术和Xe GPU架构的公布,Tiger Lake的更多细节也终于浮出了水面。


 

正如前面所提及的,Tiger Lake采用了英特尔的新一代10nm工艺,引入了全新的SuperFin晶体管结构,使得其性能相比初代10nm提升了超过15%。Tiger Lake还采用了全新的Willow Cove内核,该内核是基于Sunny Cove内核升级而来,大幅提升频率以及能效,重新设计缓存体系,引入到更大的非相容1.25MB MLC中,可提供超越代间CPU性能的提高,此外还有尔控制流强制技术(Control Flow Enforcement Technology)以强化安全性。


虽然英特尔并未公布Willow Cove的具体性能数据,但是根据官方的幻灯片透露的数据来看,在同样的电压下,Willow Cove的主频相比Sunny Cove最高可高出700MHz左右,最高主频有望超过5GHz。

与此同时,Tiger Lake还是英特尔首款在SoC架构中集成全新 Xe-LP低功耗图形微架构的处理器,实现了图形性能和AI性能的巨大飞跃。


在缓存方面,Willow Cove采用了双环形架构串联各个模块,并重新设计了缓存体系,每个核心的二级缓存容量增加到1.25MB,三级缓存容量也增大了一半,并维持极低的命中延迟,此外一致性互连带宽也增加了2倍。


在内存支持方面,Willow Cove集成双内存控制器子系统,支持DDR4-3200(初始状态)、LPDDR4X-4267、LPDDR5-5400,最大带宽可达约86GB/s,并支持Intel全内存加密技术(Total Memory Encryption),直接在硬件层面抵御安全威胁。

在AI方面,Tiger Lake还集成了高斯网络加速器GNA 2.0,可以视为英特尔版本的神经处理单元(NPU)。


在显示方面,Tiger Lake致力于在更高分辨率、画质下提供更多显示技术,比如在显示引擎与内存之间设置单独的结构通道以维持高质量画面传输,带宽最高达64GB/s。


同时Tiger Lake还集成了新一代图像处理器单元IPU6,完全硬件集成,集成最多6个传感器,支持最高4K90Hz视频输出、4200万像素静态图像输出——初期支持最高4K30Hz、2700万像素。


在IO输入输出方面,Tiger Lake集成支持新一代Thunderbolt 4、USB4,最高带宽都是40Gbps,而且物理接口(Type-C)和传输协议都彼此兼容,可以实现一口走天下,当然了Thunderbolt 4更高级一些。此外,它还在Type-C接口子系统上集成了显示输出,包括DP Alternate模式、Thunderbolt DP Tunneling,还支持独立显卡DP输入接口。PCIe 4.0也得到了原生支持,可以让CPU高带宽低延迟地访问内存,完整带宽8GB/s,相比连接芯片延迟也降低了大约100ns。


电源管理方面,一致结构、内存子系统内集成了自主DVFS(动态电压与频率调节),提高了全集成电压稳压器(FIVR)的效率,可以根据电压实现频率、电压的动态缩放调节,兼顾高能效与高性能。


综合来看,Tiger Lake相比前代产品在CPU、GPU、AI及接口支持等众多方面都有了非常大的提升。

另外,据英特尔透露Tiger Lake之后,Intel还准备了下一代CPU架构,代号Golden Cove,将会用于明年的下一代Alder Lake酷睿处理器。目前已知的变化有:提升多线程性能、提升AI性能、提升网络与AI性能、强化安全等等。


Ice Lake和Sapphire Rapids服务器芯片


在2019年的CES上,英特尔就针对PC市场推出了10nm ICE Lake平台的处理器,其整合英特尔的“Sunny Cove”微架构、AI使用加速指令集以及英特尔第11代核心显卡,支持英特尔Adaptive Sync 技术,保证平滑的帧速率,可提供1 TFLOP 以上的性能。但是,针对服务器市场的 ICE Lake却迟迟没有动静。

在此次的2020架构日活动上,英特尔公布了针对服务器市场的Ice Lake、Sapphire Rapids的更多细节。


据英特尔介绍,首款基于Ice Lake的10nm工艺制造的至强处理器,将在跨工作负载的吞吐量和响应能力方面提供强劲性能,并带来一系列新技术,包括全内存加密(Total Memory Encryption/TME)、PCIe 4.0总线写、8个内存通道(目前为6个)、可加快密码运算速度的增强指令集。


下一代的Sapphire Rapids,则继是Ice Lake之后的第二代10nm工艺至强处理器,其融入了最新的增强型SuperFin晶体管技术。它将提供领先的行业标准技术,包括DDR5内存、PCIe 5.0总线、CXL 1.1异构互联协议等等,并延续Intel的内置人工智能加速策略,支持最新的“先进的矩阵扩展”(AMX)加速。


根据预计,Ice Lake将在2020年底推出,包括针对网络存储、物联网的特殊版本。Sapphire Rapids则预计将于2021年下半年开始首批生产发货,届时还将进驻美国阿贡国家实验室“极光”超级计算机系统(Aurora Exascale)。


编辑:芯智讯-浪客剑

往期精彩文章

华为“塔山计划”被辟谣,打造去美化45/28nm产线是否可行?

营收同比增长49%,华为海思进入全球半导体十强!

重磅!华为进军OLED驱动芯片领域:首款芯片已流片!

上市首日暴涨290%!深度解析国产MEMS芯片第一股敏芯股份!

微软更新服务协议为断供中国做准备?假的!

美国封杀微信之后:手机市场或将洗牌!

9月20日生效!特朗普签署行政令:禁止美企与字节跳动及腾讯的所有交易!

突发!美国公布“干净网络”计划:全面封杀华为及中国运营商、云服务、APP等!

华为助力!联发科超越高通成国内手机芯片市场一哥!

累计出货130亿颗Flash,4亿颗MCU!深度解析兆易创新的三大产品线

Arm服务器渐成气候,x86一统天下局面将被打破

行业交流、合作请加微信:icsmart01
芯智讯官方交流群:221807116

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接