1、从通用服务器到AI服务器的过渡
AI服务器是承载智慧计算中AI计算的核心基础设施,是一种能够提供人工智能的数据服务器,既可以用于支持本地应用程序和网页,也可以为云和本地服务器提供复杂的AI模型和服务,通过异构形式适应不同应用范围以及提升服务器的数据处理能力,异构方式包括CPU+GPU/TPU/ASIC/FPGA。
复盘主流服务器的发展历程,随着数据量激增、数据场景复杂化,诞生了适用于不同场景的服务器类型:通用服务器、云计算服务器、边缘计算服务器、AI服务器。
主流服务器类型(不完全统计)
类别 |
特点 |
配置 |
应用场景 |
通用服务器 |
物理服务器,独立存在,拥有完全管理员权限和独立IP地址,安全稳定性高。 |
CPU、硬盘、内存等。 |
/ |
云计算服务器 |
通过虚拟化技术,将一台/多台服务器虚拟化成一个可以切分的资源池,客户按需灵活配置与扩展,管理便捷,费用相对低廉。 |
按客户需求配置CPU、内存、数据盘等。 |
适合对业务弹性扩展需求和易用性的需求:电商、IT行业、教育、移动应用、游戏等。 |
边缘计算服务器 |
承担70%以上的计算任务,需支持ARM/GPU/NPU等异构计算,针对不同业务场景开发,远程控制运维。 |
/ |
工业互联网、车联网、医疗保健、AR/VR、智慧城市等。 |
AI服务器 |
采用异构形式服务器,承担大量计算;大规模并行运算、多重向量/张量运算、计算效率高。 |
GPU/FPGA/ASIC等加速芯片、CPU、内存等。 |
融合深度学习、机器视觉、知识图谱等人工智能技术的应用:医疗影像智能分析、人脸/语音/指纹识别、安防监控场景等 |
数据来源:观研天下整理
2、AI服务器与普通服务器相比具有更好的技术优势
根据观研报告网发布的《中国AI服务器行业发展趋势研究与未来前景分析报告(2023-2030年)》显示,AI服务器利用CPU+的架构模式,CPU仍作为CPU的数据处理主要模块,同时植入并行式计算加速部件,如ASIC、FPGA、GPU等,负责人工智能计算负载加速。总而言之,在CPU+架构下,AI服务器的技术选型和部件配置针对不同的业务场景做相应的调整优化,通过合理的负载分担实现计算能力的提升。
AI服务器与普通服务器对比
类别 |
AI服务器 |
普通服务器 |
卡的数量 |
以加速卡为主导,基础要求为四块以上的GPU卡,甚至需要搭建外部服务器作为支持。 |
以CPU为主导,单卡/双卡CPU。 |
P2P通讯 |
GPU卡间需要大量的参数通信,模型越复杂,通信量越大:SXM3协议下,P2P带宽高值300GB/s;SXM2协议下,P2P带宽高值50GB/s;PCI3.0协议下,P2P带宽高值32GB/s。 |
普通GPU服务器一般只要求单卡性能。 |
特有设计 |
全面考虑对存储、通信、网络等相关领域的技术方案进行合理配置,使之与计算部件的计算能力相匹配,避免出现性能瓶颈。 |
/ |
专有技术 |
Purley平台更大内存带宽;NVlink提供更大的互联带宽;TensorCore提供更强的AI计算力。 |
/ |
数据来源:观研天下整理
3、服务器是AI算力的核心,TrendForce不断上修AI服务器出货量
随着ChatGPT持续爆火及GPT-4的推出,全球AI模型正在升级。而我国大模型主要包括百度文心、华为盘古、阿里通义、腾讯混云及商汤的视觉模型等,国产AI大模型也正加速突破中。
国内外主要大模型参数量
厂商 |
预训练模型 |
应用 |
参数量 |
领域 |
谷歌 |
BERT |
语言理解与生成 |
4,810亿 |
NLP |
PaLM |
语言理解与生成,推理、代码生成 |
5,400亿 |
NLP |
|
Imagen |
语言理解与图像生成 |
110亿 |
多模态 |
|
Parti |
语言理解与图像生成 |
200亿 |
多模态 |
|
微软 |
Florence |
数据额识别 |
6.4亿 |
CV |
Turing-NLG |
语言理解、生成 |
170亿 |
NLP |
|
Meta |
OPT-175B |
语言模型 |
1,750亿 |
NLP |
M2M-100 |
100种语言互译 |
150亿 |
NLP |
|
DeepMind |
Gato |
多面手的智能体 |
12亿 |
NLP |
Gopher |
语言理解与生成 |
2,800亿 |
多模态 |
|
AlphaCode |
代码生成 |
414亿 |
NLP |
|
OpenAI |
GPT3 |
语言理解与生成、推理等 |
1,750亿 |
NLP |
CLIP&DALL-E |
图像生成、跨模态检索 |
120亿 |
多模态 |
|
Codex |
代码生成 |
120亿 |
NLP |
|
英伟达 |
Megatron-TuringNLG |
语言理解与生成、推理等 |
5,300亿 |
NLP |
百度 |
文心一言 |
文本理解与创作 |
2,600亿 |
NLP |
VIMER-UFO |
视觉识别 |
170亿 |
CV |
|
ERNIE-ViLG2.0 |
语言理解与图像生成 |
/ |
多模态 |
|
华为(盘古) |
NLP大模型 |
文本理解与创作 |
1,000亿 |
NLP |
CV大模型 |
视觉识别 |
30亿 |
CV |
|
多模态大模型 |
语言理解与图像生成 |
1,000亿 |
多模态 |
|
科学计算大模型 |
气象预测 |
/ |
科学计算 |
|
阿里 |
通义-M6 |
语言理解、图像生成 |
10万亿 |
多模态 |
通义-AliceMind |
文本理解与创作 |
270亿 |
NLP |
|
通义-视觉 |
视觉识别 |
/ |
CV |
|
腾讯 |
混元AI大模型 |
语言理解和图像生成 |
1,000亿 |
多模态 |
商汤科技 |
视觉模型 |
视觉识别 |
300亿 |
CV |
数据来源:观研天下整理
服务器是AI算力的核心,近年来出货量呈现增长趋势。根据数据显示,2023年全球服务器行业有望达到1550万台。AI服务器方面,TrendForce不断上修AI服务器出货量,预计2023年AI服务器(包含搭载GPU、FPGA、ASIC等)出货量近120万台,同比增长38.4%,占整体服务器出货量近9%。
数据来源:观研天下整理
数据来源:观研天下整理
4、全球AI服务器市场扩张表现亮眼,中国市场领跑全球
随着AI所需算力扩大,AI服务器作为新型算力基础设施的主体将直接影响AI创新迭代和产业落地,未来市场规模将不断扩大。根据数据显示,2021年全球AI服务器行业市场规模为156.3亿美元,同比增长39.10%,预计2026年市场规模将达到347.1亿美元。在中国市场,受益于国内人工智能应用加速落地,浪潮信息、新华三、宁畅等厂商助推人工智能基础设施产品的优化更新,AI服务器行业蓬勃发展。根据数据显示,2021年我国AI服务器行业市场规模达到59.2亿美元,同比增长68.2%,在服务器市场中占比23.6%,预计2026年市场规模将达123.4亿美元,5年CAGR为15.82%。
数据来源:观研天下整理
数据来源:观研天下整理
5、我国服务器品牌厂商在AI服务器市场占优,市场集中度较高
在市场格局方面,2021年,我国在TOP5厂商中占据过半席位(浪潮、联想、华为),累计占比为31.1%,其中浪潮信息以20%的市占率占据榜首。而在国内市场,我国AI服务器行业市场集中度较高,浪潮信息占据近半市场,CR5超过80%。对比全球与中国AI服务器竞争格局分析,国产服务器厂商在AI服务器市场优势较为明显,未来有望放大优势,在国际市场上争取更高话语权。
数据来源:观研天下整理
国内外AI服务器厂商
公司 |
主要情况 |
浪潮信息 |
浪潮信息是全球领先的IT基础设施产品、方案和服务提供商,通过场景优化设计形成了丰富的产品线,涵盖计算型、存储型、多节点、关键应用、整机柜等各类服务器,支持全场景高效计算。2022年上半年,浪潮信息服务器出货量保持全球第二,中国第一。 |
工业富联 |
工业富联在云计算服务器出货量持续全球第一,与全球主要服务器品牌商、国内外CSP客戶深化合作,推出新一代云计算基础设施解决方案,包括模块化服务器、高效运算HPC等,重点解决因ChatGPT持续升温而引发AIGC算力井喷需求。公司多年来为数家第一梯队云服务商AI服务器(加速器)与AI存储器供应商,产品已经开发至第四代。伴随着AI硬件市场迅速成长,公司相关产品2022年出货加倍,AI服务器及HPC出货增长迅速,在2022年云服务商产品中,占比增至约20%,持续维持增长态势。 |
纬颖科技 |
纬颖科技专注于提供超大型数据中心及云端基础构架各项产品及系统的解决方案,藉由传承纬创资通丰富的创新设计技术,以及多年的制造经验,纬颖科技的顶尖团队为客户提供巨型数据中心、运营商及企业的云计算解决方案,其中包括高性价比的服务器、储存设备、网络系统、机房基础设备及软硬体整合的私有云解决方案。 |
中兴通讯 |
中兴通讯服务器产品拥有该领域多项自主知识产权及专利,涵盖机架服务器、刀片服务器和云计算节点服务器,满足互联网、高性能计算、数据库、数据中心等多种场景需求,并配合中兴通讯其它产品形成丰富的产品组合,满足客户的各种业务需要。服务于政府、金融、交通、教育、医疗、电信运营商和互联网等多个行业。 |
中科曙光 |
中科曙光以IT核心设备研发、生产制造为基础,对外提供高端计算机、存情、安全数据中心等ICT基础设施产品,大力发展云计算、大数据、人工智能、边缘计算等先进计算业务,为用户提供全方位的信息系统服务解决方案。主要产品为高端计算机、存储产品、软件开发、系统集成、技术服务。 |
超聚变 |
超聚变聚焦发展算力与生态,致力成为全球领先的算力基础设施与服务提供者,凭借在多样性算力、液冷技术等方面的优势,成功入选Gartner全球服务器代表性厂商名录。 |
新华三 |
新华三集团作为数字化解决方案领导者,致力于成为客户业务创新、数字化转型值得信赖的合作伙伴。作为紫光集团旗下的核心企业,新华三通过深度布局“云-网-算-存-端”全产业链,不断提升数字化和智能化赋能水平。新华三拥有计算、存储、网络、5G、安全、终端等全方位的数字化基础设施整体能力,提供云计算、大数据、人工智能、工业互联网、信息安全、智能联接、边缘计算等在内的一站式数字化解决方案,以及端到端的技术服务。同时,新华三也是HPE®服务器、存储和技术服务的中国独家提供商。 |
宁畅 |
宁畅信息产业(北京)有限公司是集研发、生产、部署、运维一体的服务器厂商,及IT系统解决方案提供商,为全行业客户提供基于X86架构通用机架、人工智能、多节点、边缘计算及JDM全生命周期定制等多类型服务器及IT基础设施产品。 |
英业达 |
英业达自1975年成立以来,从早期制造计算机、电话机,而后制造笔记本电脑与服务器,奠定了公司扎实稳固的基础。英业达企业电脑事业群(EBG)成立于1998年,专注服务器研发制造。英业达数据中心解决方案传承EBG,专注于提供超大型数据中心、运算密集行业包括互联网及电信运营商最佳解决方案,领先研发制造能力深获客户信任。 |
广达 |
广达电脑拥有完整及领先业界的数据中心产品线,提供各种数据中心所需的IT硬件设备,包括服务器、存储设备及网络交换机等,从产品研发、制造、整合到优化,为客户提供最全面的一站式服务,以丰富经验协助客户解决下一代数据中心于设计及运营上的挑战,并为云端服务运营商、电信运营商以及企业用户建构公有云、混合云与私有云。 |
拓维信息 |
拓维信息作为中国领先的软硬一体化产品及解决方案提供商,依托自身10多年的行业云服务能力,基于自主研发的行业PaaS平台,为政企客户提供SaaS化产品、云化解决方案、智能硬件、咨询规划、项目设计、运维服务、信息安全等一站式拓维云服务,目前业务已覆盖全国近20个省市,覆盖了政府、教育、通信、金融、制造、交通等十多个领域。 |
中国长城 |
中国长城科技集团股份有限公司是中国电子信息产业集团有限公司旗下“安全、先进、绿色自主计算产业专业子集团”,是中国“PKS”自主计算体系建设主力军和网信科技自主创新生力军。中国长城持续聚焦自主计算产业、系统装备核心主业。中国长城坚持“芯端一体,双核驱动”的发展战略,致力于构建以“芯-端”为核心的自主计算产品链,全面带动“网-云-数-智”自主计算产业生态发展。自重组以来成功突破高端通用芯片(CPU)、固件等关键核心技术,依托“PKS”自主计算体系,构建了从芯片、台式机、笔记本、服务器、网络交换设备到应用系统等具有完整自主知识产权的产品谱系,成功赋能党政办公及金融、能源、电信、交通等重点信息化领域的数字化转型。 |
宝德科技 |
宝德计算机系统股份有限公司是以服务器和PC整机的研发、生产、销售及提供相关的综合解决方案为主营业务的国家级高新技术企业和国家专精特新“小巨人”企业,致力于成为中国领先的计算产品方案提供商,为政府、互联网、教育、金融、电力、交通、医疗、运营商、安平等行业客户持续提供先进的算力产品、解决方案和全栈服务。多年来,凭借不断创新的产品技术和独特的软硬件综合实力,宝德计算勇夺信创市场NO.1,稳居X86服务器国内品牌TOP5和全球TOP9、中国AI服务器NO.3。 |
数据来源:观研天下整理(WYD)

【版权提示】观研报告网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至kf@chinabaogao.com,我们将及时沟通与处理。