上海张江又一款AI芯发布!性能超英伟达T4,AMD背景团队创办,快手投资

百家 作者:量子位 2021-07-08 13:42:01
晓查 发自 上海
量子位 报道 | 公众号 QbitAI

今年4月刚刚5亿元人民币A+轮融资的AI芯片公司瀚博半导体,发布了云端推理AI芯片SV100系列,以及搭载该系列芯片的AI推理加速卡VA1

在发布会上,瀚博半导体创始人兼CEO钱军展示了SV100系列的首款产品——SV102智能视觉芯片,瀚博半导体CTO张磊展示了VA1板卡。

瀚博半导体这两款产品主要瞄准了AI领域中成熟的CV市场,主打低延时、多路视频处理能力,相比市面上的GPU在能效上具有优势,可节省60%服务器成本。

瀚博半导体CEO和CTO均来自AMD,公司于2018年2月创立,作为一家新兴AI芯片公司,瀚博发展迅速,在去年5月就完成了首颗半定制7nm芯片流片,之后又获得了快手等领投的5000万美元的A轮融资。

云端推理芯片SV100系列

SV100系列是瀚博为云端推理而打造的服务器芯片,SV102是该系列的第一款芯片,INT8峰值算力达到200TOPS。

瀚博半导体创始人兼CEO钱军认为,目前AI落地应用已经日趋成熟,根据调研机构IDC的报告,从今年开始,AI基础设备市场上的推理负载将超过训练负载,而且今后二者差距将越来越大。

因此瀚博半导体选择进入了云端AI推理硬件的赛道。

钱军表示,SV102具有超高推理性能、超低延时以及高密度视频解码等特点。

SV102支持64路1080p视频解码,最大功耗为75W,接口为PCIe Gen4 x16,采用被动散热。

这款芯片在今年6月刚刚测试成功。据钱军透露,SV100在开始测试之后8分钟就全部点亮,低于40小时之内所有模块基础测试提前完成。

“这个对于一个全新设计的高端芯片是一个奇迹”,钱军说。

VA1板卡

而搭载SV102的VA1采用单宽半高半长75瓦PCIe卡设计,因此相比一般的GPU卡更节省能耗与空间。

张磊表示,在ResNet-50的基准测试中,VA1是英伟达T4吞吐量的2倍以上。

由于VA1节省服务器50%以上TCO,因此在一个2U服务器中,搭载VA1的设备可以解码384路视频,整机算力是T4设备的2.5倍以上,功耗比相同搭载GPU的服务器更低,可节省60%的服务器成本。

在视频处理方面,VA1支持64路以上H264、H265或AVS2 1080p解码,分辨率支持高达8K。

除了硬件产品外,瀚博也搭建了自己的VastStream AI软件平台,支持PyTorch、TensorFlow等主流AI框架,目前正在与CentOS、Ubuntu、Red Hat、银河麒麟等服务器操作系统进行适配。

最后,SV102芯片与VA1板卡预计将今年第四季度量产。

钱军透露说,未来瀚博半导体还将推出15W~150W不同功耗范围的AI推理产品供用户选择。

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

英伟达NLP公开课 | 免费报名

7.14晚8点,英伟达专家将通过理论讲解与代码演示,分享如何使用NeMo快速实现NLP中的信息抽取任务。快来扫码报名吧~



点这里

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接