1、DPU是以数据为中心构造的专用处理器
根据观研报告网发布的《中国数据处理芯片(DPU)行业现状深度分析与投资前景预测报告(2024-2031年)》显示,DPU是强化数据面性能的专用处理器,2020年NVIDIA公司发布的DPU产品战略中将其定位为数据中心继CPU和GPU之后的“第三颗主力芯片”,其也许是体系结构朝着专用化路线发展的又一个里程碑。应用层面,DPU要解决的核心问题是基础设施的“降本增效”,即将“CPU处理效率低下、GPU处理不了”的负载卸载到专用DPU,提升整个计算系统的效率、降低整体系统的总体拥有成本(TCO)。场景层面,数据中心是DPU的组主要应用场景,DPU的出现,逐步推动计算平台从“计算为中心”转向“数据为中心”。
2、全球DPU行业规模大,增速快,中国市场呈现跳跃式增长
近年来,随着物联网、大数据、AI、算力、大模型等新兴产业快速发展,带动DPU行业规模持续扩大,市场增速较快。根据数据显示,2020年全球DPU市场规模仅31亿美金,2025年将达到245亿美金,CAGR达51%;国内市场来看,2020年我国DPU市场规模仅为4亿美金,2021年市场规模迅速增长至75亿美金,2025年将达到566亿美金,2021-2025年CAGR达50%,呈现跳跃式增长。
数据来源:观研天下整理
数据来源:观研天下整理
3、DPU行业应用正在走向多场景化
DPU通过将控制平面下放,实现主机业务与控制平面的完全隔离,进而提升虚拟环境的安全性。随着存储行业革新算法和实现,可以在DPU架构中,独立于服务器操作系统进行部署。例如,在网络与安全方面,随着数据泄露和隐私泄露的事件频发,数据安全和隐私保护备受社会关注。DPU可以利用可编程硬件卸载和加速内联安全服务,提供强大的零信任保护,有效隔离主机业务和控制平面,确保数据安全性。因此,数据中心成为DPU主要的应用领域之一。
不过,随着技术升级,DPU可提供超高带宽、无损网络和高速存储访问能力,DPU也逐渐在多个领域得到应用。例如,在风起云涌的边缘计算领域,随着业务增多,边缘算力和带宽需求大幅增加,但规模和能力受限,所以引入DPU不仅能大幅度降低DPU对CPU的消耗,同时使用专用硬件提升处理性能,进而提升边缘计算的处理能力。
在智算领域,DPU通过高性能网络及领域功能硬件卸载,为智算中心提供大带宽、高吞吐、低时延的基础设施能力,进而消除数据IO瓶颈,释放了算力,这使得DPU成为智算中心基础设施的必选项,大幅提升计算集群的算效比。
在智能汽车领域,智能汽车或将成为DPU另一主要的需求场景,L2级别的智能汽车中回来可能至少会搭配一颗DPU芯片,而L3级别以上的智能汽车中未来至少会搭载2颗以上的DPU芯片。根据资料显示,2023年L2级别的车辆渗透率将达到26%,L3级别的渗透率将达到3%,以此测算,2023年车辆DPU的市场空间上限约613亿元。
2021-2025年我国DPU空间测算——智能驾驶需求
类别 |
2021年 |
2022年 |
2023年E |
2024年E |
2025年E |
汽车销量(万辆) |
2625 |
2684 |
2738 |
2792 |
2848 |
YoY(%) |
4% |
2% |
2% |
2% |
2% |
L2渗透率(%) |
18% |
22% |
26% |
29% |
33% |
L2汽车数量(万辆) |
473 |
590 |
712 |
810 |
940 |
单车对应DPU数(个) |
1 |
1 |
1 |
1 |
1 |
L3渗透率(%) |
/ |
1% |
3% |
4% |
6% |
L3汽车数量(万辆) |
/ |
27 |
82 |
112 |
171 |
单车对应DPU数(个) |
2 |
2 |
2 |
2 |
2 |
对应DPU需求(万个) |
473 |
644 |
876 |
1033 |
1282 |
DPU单价(元) |
7000 |
7000 |
7000 |
7000 |
7000 |
对应市场空间上限(亿元) |
331 |
451 |
613 |
723 |
897 |
资料来源:观研天下整理
除上述应用场景外,数据通信、网络安全等也成为DPU行业下游应用领域。多元化应用场景为DPU行业带来丰富的商业机遇,未来有望进一步拓展至自动驾驶、人工智能和元宇宙等领域。
4、DPU战场百家争鸣
因此,我国DPU行业发展前景广阔。并且,随着DPU技术方案更加成熟、数据中心加速落地,英伟达、英特尔等厂商数据处理类芯片DPU/IPU大规模量产,DPU市场将迎来爆发式增长。
目前,DPU行业市场集中度较高,国际三大巨头英伟达、博通、Intel占据主要份额,分别达到55%、36%、9%。同时,Xilinx、Marvell、Pensando、Fungible、Amazon、Microsoft等厂商在近2-5年内均有DPU或相似架构产品生产。
数据来源:观研天下整理
DPU代表性厂商、产品及应用方向和发布时间
厂商 |
代表产品 |
应用方向 |
发布时间 |
NVIDIA |
BlueField-2(DPU系列 |
)数据安全、网络安全、存储卸载等 |
2020年 |
BlueField-3(DPU系列) |
数据安全、网络安全、存储卸载等 |
2021年 |
|
BlueField-4(DPU系列 |
数据安全、网络安全、存储卸载等 |
2023年 |
|
Intel |
FPGAIPUC5020x(IPU系列) |
面向交换机、路由器芯片 |
2020年 |
Xilinx |
AlveoU25 |
面向网络、存储和计算加速功能 |
2020年 |
Marvell |
OCTEON10 |
面向集成机器学习推理的引擎、内联加密处理器、以及矢量数据包处理器等的虚拟化 |
2021年 |
Broadcom |
Stingray |
面向交换机、路由器芯片 |
2018年 |
Pensando |
Capri |
面向P4的SDN |
- |
Fungible |
F1 |
面向网络、存储、虚拟化 |
2020年 |
Amazon |
Nitro |
为智能网卡数据提供线速加密和解密 |
- |
Microsoft |
CatapultV3 |
面向深层神经网络加速 |
2017年 |
阿里SmartNIC |
X-DragonSmartNIC(MOC) |
面向虚拟机管理程序 |
2017年 |
资料来源:观研天下整理
英伟达发布了面向开发者的平台DOCA SDK,通过集成Ampere GPU和BlueField2 DPU优化EGXAI平台,向流媒体、智能驾驶、医疗等终端场景扩展。BlueField 3已在2022年发布。同时,英伟达Blue Field 4发布,预计性能可提升600倍,达到75/400TOPS,400Gbps,吞吐量有望较BlueField2提升600倍。此外,英伟达希望凭借GPU和Mellanox智能网卡技术壁垒的协同效应,再辅以Arm处理器整合协同后的性能提升,有望进一步抗衡英特尔/AMD的x86CPU体系。
英伟达Bluefield DPU情况
类别 |
BlueField1 |
BlueField2 |
BlueField2X |
内核 |
16颗,ArmA72CPU芯片 |
8颗,ArmA72CPU芯片 |
8颗,ArmA72CPU芯片 |
网络连 |
接ConnectX5,双端口100GbpsEthernet或InfiniBand链接 |
ConnectX6Dx智能网卡双端口25/50/100Gps,单端口200Gps的Ethernet或InfiniBand链接 |
ConnectX-6Dx智能网卡双端口25/50/100Gps,单端口200Gps的Ethernet或InfiniBand链接 |
Al加速器 |
GPUDirectRDMA |
GPUDirectRDMA |
基于Ampere架构的GPU |
加速器引擎 |
/ |
2个VLIW加速器 |
2个VLIW加速器 |
PCle接口 |
PCleGen4.0 |
100Gbps的PCleGen4.0 |
100Gbps的PCleGen4.0 |
内存 |
DDR4存储模块 |
DDR4DIMM存储模块 |
DDR4DIMM存储模块 |
资料来源:观研天下整理
5、国内DPU厂商各展所长,蓄势待发
不过,随着国家不断推动数字经济快速发展,算力基础设施成为重要基础。近年来,在人工智能和边缘计算等需求的推动下,高性能网络和DPU已愈发重要。工业和信息化部、中央网信办、教育部、国家卫生健康委、中国人民银行、国务院国资委等六部门联合印发《算力基础设施高质量发展行动计划》,其中重点提出针对智能计算、超级计算和边缘计算等场景,开展DPU等技术升级与试点应用,实现算力中心网络高性能传输。这也为DPU行业未来发展指明了方向,国内也涌现出一大批DPU公司,如阿里云、百度智能云、中科驭数、芯启源、云豹智能、大禹智芯等,均凭借技术创新与产品定义方面的优势,沿着差异化路线抢滩市场。
星云智联:首款DPU产品NebulaX D1055AS发布,聚焦云计算的裸金属、虚机、容器等场景,实现网络与存储卸载与加速,提升业务性能,节省主机CPU,简化IaaS运维,可广泛用于互联网、公有云、运营商、政企与行业的云基础设施。根据星云智联官方数据,管控面采用通用的CPU+Linux架构,其中DPU OS上运行了OVS控制面、弹性块存储客户端EBS-Client、管理监控等软件,支持带外管理网口,通过管理网络对接云平台。这个架构拥有极好的软件生态兼容性,用户可按需安装部署相应的管理和应用软件,并且简化了DPU与用户云管控平台集成,加速定制化DPU新功能开发上线。
星云智联DPU产品解决方案
具体方面 |
具备业界领先 |
全硬件高密度I/O虚拟化 |
SR-IOV1KVF,2K硬件virtio队列 |
virtio-net和virtio-blk1.0和1.1版本,裸机免驱动安装 |
|
vDPA实现虚机平滑热迁移,既保证与Hypervisor上内存脏页状态一致,又提升了硬件刷新“dirtypagebitmap”效率 |
|
全硬件卸载高性能网络转发 |
硬件高速流查找算法,实现50Mpps高性能线速包处理 |
百万级超大流表,减少OVS流表换入换出,保证高吞吐,低延迟转发 |
|
识别协议和QoS标签流分类,4级层次化QoS调度和流控,实现对每租户、每虚机/容器、每业务进行流量管理 |
|
全硬件卸载灵活多样存储栈 |
硬件模拟PCIeNVMe设备和Virtio-blk设备,支持HOST云盘启动,云盘挂载 |
支持iSCSIinitiator,NVMeoF/TCP,NVMeoF/RDMA,CephRBD等多种存储客户端,或客户自行定制开发 |
|
硬件加速存储协议栈,实现最高50万IOPS读写性能 |
|
创新RDMA更强扩展性 |
自研NBL-CC拥塞控制算法,不依赖网络设备PFC/ECN实现动态拥塞控制 |
自研NBL-SRP选择重传算法,在Lossy网络环境仍可实现低延时,高有效吞吐量 |
|
标准RoCEv2协议和VerbsAPI,配置简洁,参数模板化,易运维 |
|
完整管控面卸载 |
独立于HOST运行的DPUOS,内置网络与存储管控面,IPMI板级监控管理软件 |
按需部署OpenStackagent,K8SKubelet等IaaS/PaaS应用插件 |
|
生态开放,客户可按需安装自有云平台插件,运维工具等 |
资料来源:观研天下整理
此外,大禹智芯也拥有DPU设计与研发及DPU大型商业化部署的成功经验,其Paratus系列DPU产品采用三条产品线并行的方式逐步面向广泛商用市场推出易用并好用的DPU产品;云脉芯联打造自主研发多场景RDMA DPU产品,如xFusion50基于硬件实现的可编程拥塞控制算法能够有效避免网络拥塞,充分发挥RDMA技术的低延迟和高性能,支持云计算、高性能计算、AI、存储集群全场景部署,是国内首款实现包括支持端到端拥塞控制完整RDMA功能的DPU产品。
大禹智芯Paratus系列DPU产品简介
资料来源:观研天下整理
6、我国DPU行业将进入爆发期
不过,目前,我国DPU仍处于发展早期阶段。长期来看,在数据中心、智能驾驶、网络安全等应用领域加速发展的背景下,我国DPU行业仍然具有极大的市场发展潜力。尤其是,DPU与DOCA对于大模型和生成式AI而言,意义重大。根据相关资料,预计2026年超过80%的企业将使用生成式AI应用程序编程接口(API)或模型,或者在相关生产环境中部署支持生成式AI的应用程序。
但是在2023年,企业使用生成式AI应用程序编程接口(API)或模型的数量占比不足5%,这意味着2023-2026年采用或创建生成式AI模型的企业数量将会增长16倍。同时,亚马逊、阿里云、华为在内的云计算龙头都在发展符合自身要求的DPU产品线,所以在市场大环境与企业积极研发双重因素驱动下,我国DPU行业将迎来机遇期,并且有望进入市场爆发期。(WYD)
【版权提示】观研报告网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至kf@chinabaogao.com,我们将及时沟通与处理。