前言:
我国是数据大国,但不是数据资源强国,数据留存率远低于发达国家水平。数据的大量浪费制约了我国数据资源价值的发挥,在此背景下,数据标注行业发展受到国家重点关注。海天瑞声、格灵深瞳、云天励飞、博彦科技等A股上市公司正围绕政策要求及市场需求,积极布局数据标注相关产业。未来随着专业人才短缺问题得以解决,我国数据标注行业发展有望迈上新台阶。
一、数据大量浪费情况严重,数据标注行业发展受到国家重点关注
2025年1月13日,国家发展改革委、国家数据局、财政部、人力资源社会保障部四部门联合发布《关于促进数据标注产业高质量发展的实施意见》。《意见》强调,到2027年,数据标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%。
在上述政策发布以前,国家已多次出台相关政策推动数据标注行业发展。如《关于加快建设全国统一大市场的意见》提出加快培育数据要素市场,建立健全数据安全、权利保护、跨境传输管理、交易流通、开放共享、安全认证等基础制度和标准规范,深入开展数据资源调查,推动数据资源开发利用。《“数据要素×”三年行动计划(2024-2026年)》指出选取工业制造、现代农业、商贸流通、交通运输、金融服务、科技创新、文化旅游、医疗健康、应急管理、气象服务、城市治理、绿色低碳等12个行业和领域,推动发挥数据要素乘数效应,释放数据要素价值。
我国数据标注行业相关政策
时间 | 政策 | 发布部门 | 主要内容 |
2022.01 | 《“十四五”数字经济发展规划》 | 国务院 | 充分发挥数据要素作用,强化高质量数据要素供给,提升数据管理水平和数据质量。加快数据要素市场化流通,鼓励市场主体探索数据资产定价机制。严历打击数据黑市交易,营造安全有序的市场环境。以实际应用需求为导向,探索建立多样化的数据开发利用机制。 |
2022.04 | 《关于加快建设全国统一大市场的意见》 | 中共中央、国务院 | 加快培育数据要素市场,建立健全数据安全、权利保护、跨境传输管理、交易流通、开放共享、安全认证等基础制度和标准规范,深入开展数据资源调查,推动数据资源开发利用。 |
2022.06 | 《关于构建数据基础制度更好发挥数据要素作用的意见》 | 国务院 | 建立数据产权制度,推进公共数据、企业据、个人数据分类分级确权授权使用,建立数据资源持有权数据加工使用权、数据产品经营权等分置的产权运行机制,健全数据要素权益保护制度。 |
2023.12 | 《数据经济促进共同富裕实施方案》 | 国家发展改革委、国家数据局 | 旨在利用数字技术推动经济发展,缩小地区、城乡、群体和公共服务之间的差距,实现共同富裕。到2025年,预期在缩小差距方面取得积极进展,并在2030年取得显著成效。 |
2023.12 | 《深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》 | 国家发展改革委、国家数据局等五部门 | 差异化统筹布局行业特征突出的数据集群,促进行业数据要素有序流通,打造一批涵盖算力利用与数据开发的行业数据应用空间,服务行业大模型的基础实验及商业化应用。推动各级各类数据流通交易平台利用国家枢纽节点算力资源开展数据流通应用服务,促进数据要素关键信息登记上链、存证备份、追溯溯源。 |
2024.01 | 《“数据要素X”三年行动计划(2024-2026年)》 | 国家数据局等17部门 | 《行动计划》选取工业制造、现代农业、商贸流通、交通运输、金融服务、科技创新、文化旅游、医疗健康、应急管理、气象服务、城市治理、绿色低碳等12个行业和领域,推动发挥数据要素乘数效应,释放数据要素价值。 |
资料来源:观研天下整理
数据标注产业的发展受到国家的重点关注,主要由于数据的大量浪费制约了我国数据资源价值的发挥。伴随着数字中国建设的推进,我国数字经济迈向了全面扩展期,数据成为了新的生产要素。通用人工智能的发展更进一步催生海量数据,2023年我国数据生产总量超32ZB。我国是数据大国,但不是数据资源强国,2023年保存数据仅有2.9%,数据留存率远低于发达国家水平。
数据来源:观研天下数据中心整理
二、我国数据标注市场规模持续增长,目前以数据资源定制服务为主
2021-2024年我国数据标注市场规模已由43.3亿元增长至77.3亿元,在政策推动下,我国数据标注市场规模将进一步增长,预计至2027年超150亿元,至2029年超200亿元。
数据来源:观研天下数据中心整理
从细分市场结构看,我国数据标注以数据资源定制服务为主,占比约为85%,标准化数据集产品占比较小,约为13%。
数据来源:观研天下数据中心整理
三、相关企业积极布局,数据标注核心技术攻关速度有望加快
数据标注是数字经济发展的基础性、战略性产业,为培育和壮大市场主体,国家鼓励企业加快科技创新投入;重点布局跨语言、跨领域、跨模态语义对齐、4D标注、大模型标注、数据合成等标注核心技术攻关项目;支持研发专家标注、多模态标注、众包标注、标注审查、质量评估等智能化高端化工具,提升数据标注科技水平。
截至目前,海天瑞声、格灵深瞳、云天励飞、博彦科技等A股上市公司正围绕政策要求及市场需求,积极布局数据标注相关产业。如在4D数据标注领域,海天瑞声通过在自动驾驶领域用于标注车辆、行人、交通标志等物体在不同时刻的位置和运动状态,帮助自动驾驶系统理解道路场景的动态变化,提升自动驾驶系统的感知能力等。
我国数据标注行业相关企业布局情况
企业名称 | 布局情况 |
海天瑞声 | 2023年5月,海天瑞声发布了全新升级的智能驾驶数据处理平台DOTS-AD,具备3D点云语义分割、BEV、300万大点云以及4D标注等前沿数据标注能力,并不断优化算法中台中枢能力,引入最新SAM开源模型,提升2D语义分割项目中的降本增效能力。在大模型数据服务业务方面,公司与国内众多知名大模型厂商合作,业务范围覆盖RLHF数据评分、Prompt改写、人机多轮交互等强化学习阶段数据需求,并发布了首个大语言模型预训练数据集DOTS-NLP-216。公司通过前瞻性研究,探索拓展大模型相关数据服务范围及服务能力,提升大模型数据的规模化生产效率。 |
格灵深瞳 | 公司利用自研的底层AI技术平台深瞳大脑对数十亿训练数据进行清洗,并训练大规模数据基础模型,在海量数据下,研发了基于多模态弱监督的大模型训练算法,节省了大量数据标注资源。公司自研的海量数据算法生产技术通过自有的核心算法结合大数据平台的分析处理技术,支持在海量数据中进行挖掘,主动触发模型更新训练,有效的提高了算法的准确率和生产率。同时,公司自建的数据标注平台,通过组建具有专业背景的标注团队,用人工标注加AI模型自动化预识别的方法,为算法提供精准的基础训练数据,可覆盖公司内部99%的算法标注任务。 |
云天励飞 | 公司自研大规模训练及部署技术,旨在于打通从数据底座、数据标注、模型训练、模型部署、模型评测等从数据到模型生产的全链条,用于公司内部技术沉淀、降本增效以及外部长尾算法的生产。目前已经形成了智能自研数据标注系统、可标准化高效生产算法的YMIR平台、支持分布式的模型部署平台以及自动化模型评测平台。 |
博彦科技 | 博彦科技依托自身强大的研发与创新能力,广泛采用基于大数据、人工智能和云计算等新兴技术,搭建了人工智能计算平台,拥有涵盖样本标注、模型部署、模型训练和模型推理服务的一站式AI开发能力,可协助金融、互联网和制造等行业用户快速进行模型训练和部署,管理全周期AI工作流程,降低模型开发门槛,并协助研发人员迅速推出AI模型服务。 |
资料来源:观研天下整理
四、我国数据标注行业仍面临挑战,专业人才短缺问题亟待解决
随着技术的进步,数据标注行业也在向知识密集型转变,这意味着对于高学历和拥有专业技能的人才的需求将会增加。数据显示,数据标注此前较少有人关注,当ChatGPT火爆全球后,其需求量大幅增长,2023年增速达34.43%。从行业分布来看,数据标注新发职位主要集中于互联网、计算机软件、人工智能三大行业,占比为29.65%、12.7%、9.96%。相较日益增长的市场需求,我国数据标注人才数量不足,成为制约我国数据标注行业发展的重要因素之一。
未来,通过加强职业教育和培训体系建设,支持高校和职业院校开设数据标注相关专业和课程;推动企业与教育机构合作,共建实训基地和培训中心,培养具备专业技能和职业素养的数据标注人才;制定吸引和留住高层次人才的政策措施,促进数据标注领域的国际交流与人才合作,我国数据标注专业人才短缺的情况将得到缓解,行业发展也有望迈上新台阶。
数据来源:观研天下数据中心整理(zlj)
注:上述信息仅作参考,图表均为样式展示,具体数据、坐标轴与数据标签详见报告正文。
个别图表由于行业特性可能会有出入,具体内容请联系客服确认,以报告正文为准。
更多图表和内容详见报告正文。
观研报告网发布的《中国数据标注行业现状深度分析与发展前景预测报告(2025-2032年)》涵盖行业最新数据,市场热点,政策规划,竞争情报,市场前景预测,投资策略等内容。更辅以大量直观的图表帮助本行业企业准确把握行业发展态势、市场商机动向、正确制定企业竞争战略和投资策略。
本报告依据国家统计局、海关总署和国家信息中心等渠道发布的权威数据,结合了行业所处的环境,从理论到实践、从宏观到微观等多个角度进行市场调研分析。
行业报告是业内企业、相关投资公司及政府部门准确把握行业发展趋势,洞悉行业竞争格局,规避经营和投资风险,制定正确竞争和投资战略决策的重要决策依据之一。
本报告是全面了解行业以及对本行业进行投资不可或缺的重要工具。观研天下是国内知名的行业信息咨询机构,拥有资深的专家团队,多年来已经为上万家企业单位、咨询机构、金融机构、行业协会、个人投资者等提供了专业的行业分析报告,客户涵盖了华为、中国石油、中国电信、中国建筑、惠普、迪士尼等国内外行业领先企业,并得到了客户的广泛认可。
目录大纲:
【第一部分 行业定义与监管 】
第一章 2020-2024年中国数据标注行业发展概述
第一节 数据标注行业发展情况概述
一、数据标注行业相关定义
二、数据标注特点分析
三、数据标注行业基本情况介绍
四、数据标注行业经营模式
1、生产模式
2、采购模式
3、销售/服务模式
五、数据标注行业需求主体分析
第二节 中国数据标注行业生命周期分析
一、数据标注行业生命周期理论概述
二、数据标注行业所属的生命周期分析
第三节 数据标注行业经济指标分析
一、数据标注行业的赢利性分析
二、数据标注行业的经济周期分析
三、数据标注行业附加值的提升空间分析
第二章 中国数据标注行业监管分析
第一节 中国数据标注行业监管制度分析
一、行业主要监管体制
二、行业准入制度
第二节 中国数据标注行业政策法规
一、行业主要政策法规
二、主要行业标准分析
第三节 国内监管与政策对数据标注行业的影响分析
【第二部分 行业环境与全球市场】
第三章 2020-2024年中国数据标注行业发展环境分析
第一节 中国宏观环境与对数据标注行业的影响分析
一、中国宏观经济环境
一、中国宏观经济环境对数据标注行业的影响分析
第二节 中国社会环境与对数据标注行业的影响分析
第三节 中国对外贸易环境与对数据标注行业的影响分析
第四节 中国数据标注行业投资环境分析
第五节 中国数据标注行业技术环境分析
第六节 中国数据标注行业进入壁垒分析
一、数据标注行业资金壁垒分析
二、数据标注行业技术壁垒分析
三、数据标注行业人才壁垒分析
四、数据标注行业品牌壁垒分析
五、数据标注行业其他壁垒分析
第七节 中国数据标注行业风险分析
一、数据标注行业宏观环境风险
二、数据标注行业技术风险
三、数据标注行业竞争风险
四、数据标注行业其他风险
第四章 2020-2024年全球数据标注行业发展现状分析
第一节 全球数据标注行业发展历程回顾
第二节 全球数据标注行业市场规模与区域分布情况
第三节 亚洲数据标注行业地区市场分析
一、亚洲数据标注行业市场现状分析
二、亚洲数据标注行业市场规模与市场需求分析
三、亚洲数据标注行业市场前景分析
第四节 北美数据标注行业地区市场分析
一、北美数据标注行业市场现状分析
二、北美数据标注行业市场规模与市场需求分析
三、北美数据标注行业市场前景分析
第五节 欧洲数据标注行业地区市场分析
一、欧洲数据标注行业市场现状分析
二、欧洲数据标注行业市场规模与市场需求分析
三、欧洲数据标注行业市场前景分析
第六节 2025-2032年全球数据标注行业分布走势预测
第七节 2025-2032年全球数据标注行业市场规模预测
【第三部分 国内现状与企业案例】
第五章 中国数据标注行业运行情况
第一节 中国数据标注行业发展状况情况介绍
一、行业发展历程回顾
二、行业创新情况分析
三、行业发展特点分析
第二节 中国数据标注行业市场规模分析
一、影响中国数据标注行业市场规模的因素
二、中国数据标注行业市场规模
三、中国数据标注行业市场规模解析
第三节 中国数据标注行业供应情况分析
一、中国数据标注行业供应规模
二、中国数据标注行业供应特点
第四节 中国数据标注行业需求情况分析
一、中国数据标注行业需求规模
二、中国数据标注行业需求特点
第五节 中国数据标注行业供需平衡分析
第六节 中国数据标注行业存在的问题与解决策略分析
第六章 中国数据标注行业产业链及细分市场分析
第一节 中国数据标注行业产业链综述
一、产业链模型原理介绍
二、产业链运行机制
三、数据标注行业产业链图解
第二节 中国数据标注行业产业链环节分析
一、上游产业发展现状
二、上游产业对数据标注行业的影响分析
三、下游产业发展现状
四、下游产业对数据标注行业的影响分析
第三节 中国数据标注行业细分市场分析
一、细分市场一
二、细分市场二
第七章 2020-2024年中国数据标注行业市场竞争分析
第一节 中国数据标注行业竞争现状分析
一、中国数据标注行业竞争格局分析
二、中国数据标注行业主要品牌分析
第二节 中国数据标注行业集中度分析
一、中国数据标注行业市场集中度影响因素分析
二、中国数据标注行业市场集中度分析
第三节 中国数据标注行业竞争特征分析
一、企业区域分布特征
二、企业规模分布特征
三、企业所有制分布特征
第八章 2020-2024年中国数据标注行业模型分析
第一节 中国数据标注行业竞争结构分析(波特五力模型)
一、波特五力模型原理
二、供应商议价能力
三、购买者议价能力
四、新进入者威胁
五、替代品威胁
六、同业竞争程度
七、波特五力模型分析结论
第二节 中国数据标注行业SWOT分析
一、SWOT模型概述
二、行业优势分析
三、行业劣势
四、行业机会
五、行业威胁
六、中国数据标注行业SWOT分析结论
第三节 中国数据标注行业竞争环境分析(PEST)
一、PEST模型概述
二、政策因素
三、经济因素
四、社会因素
五、技术因素
六、PEST模型分析结论
第九章 2020-2024年中国数据标注行业需求特点与动态分析
第一节 中国数据标注行业市场动态情况
第二节 中国数据标注行业消费市场特点分析
一、需求偏好
二、价格偏好
三、品牌偏好
四、其他偏好
第三节 数据标注行业成本结构分析
第四节 数据标注行业价格影响因素分析
一、供需因素
二、成本因素
三、其他因素
第五节 中国数据标注行业价格现状分析
第六节 2025-2032年中国数据标注行业价格影响因素与走势预测
第十章 中国数据标注行业所属行业运行数据监测
第一节 中国数据标注行业所属行业总体规模分析
一、企业数量结构分析
二、行业资产规模分析
第二节 中国数据标注行业所属行业产销与费用分析
一、流动资产
二、销售收入分析
三、负债分析
四、利润规模分析
五、产值分析
第三节 中国数据标注行业所属行业财务指标分析
一、行业盈利能力分析
二、行业偿债能力分析
三、行业营运能力分析
四、行业发展能力分析
第十一章 2020-2024年中国数据标注行业区域市场现状分析
第一节 中国数据标注行业区域市场规模分析
一、影响数据标注行业区域市场分布的因素
二、中国数据标注行业区域市场分布
第二节 中国华东地区数据标注行业市场分析
一、华东地区概述
二、华东地区经济环境分析
三、华东地区数据标注行业市场分析
(1)华东地区数据标注行业市场规模
(2)华东地区数据标注行业市场现状
(3)华东地区数据标注行业市场规模预测
第三节 华中地区市场分析
一、华中地区概述
二、华中地区经济环境分析
三、华中地区数据标注行业市场分析
(1)华中地区数据标注行业市场规模
(2)华中地区数据标注行业市场现状
(3)华中地区数据标注行业市场规模预测
第四节 华南地区市场分析
一、华南地区概述
二、华南地区经济环境分析
三、华南地区数据标注行业市场分析
(1)华南地区数据标注行业市场规模
(2)华南地区数据标注行业市场现状
(3)华南地区数据标注行业市场规模预测
第五节 华北地区数据标注行业市场分析
一、华北地区概述
二、华北地区经济环境分析
三、华北地区数据标注行业市场分析
(1)华北地区数据标注行业市场规模
(2)华北地区数据标注行业市场现状
(3)华北地区数据标注行业市场规模预测
第六节 东北地区市场分析
一、东北地区概述
二、东北地区经济环境分析
三、东北地区数据标注行业市场分析
(1)东北地区数据标注行业市场规模
(2)东北地区数据标注行业市场现状
(3)东北地区数据标注行业市场规模预测
第七节 西南地区市场分析
一、西南地区概述
二、西南地区经济环境分析
三、西南地区数据标注行业市场分析
(1)西南地区数据标注行业市场规模
(2)西南地区数据标注行业市场现状
(3)西南地区数据标注行业市场规模预测
第八节 西北地区市场分析
一、西北地区概述
二、西北地区经济环境分析
三、西北地区数据标注行业市场分析
(1)西北地区数据标注行业市场规模
(2)西北地区数据标注行业市场现状
(3)西北地区数据标注行业市场规模预测
第九节 2025-2032年中国数据标注行业市场规模区域分布预测
第十二章 数据标注行业企业分析(随数据更新可能有调整)
第一节 企业一
一、企业概况
二、主营产品
三、运营情况
1、主要经济指标情况
2、企业盈利能力分析
3、企业偿债能力分析
4、企业运营能力分析
5、企业成长能力分析
四、公司优势分析
第二节 企业二
一、企业概况
二、主营产品
三、运营情况
1、主要经济指标情况
2、企业盈利能力分析
3、企业偿债能力分析
4、企业运营能力分析
5、企业成长能力分析
四、公司优势分析
第三节 企业三
一、企业概况
二、主营产品
三、运营情况
1、主要经济指标情况
2、企业盈利能力分析
3、企业偿债能力分析
4、企业运营能力分析
5、企业成长能力分析
四、公司优势分析
第四节 企业四
一、企业概况
二、主营产品
三、运营情况
1、主要经济指标情况
2、企业盈利能力分析
3、企业偿债能力分析
4、企业运营能力分析
5、企业成长能力分析
四、公司优势分析
第五节 企业五
一、企业概况
二、主营产品
三、运营情况
1、主要经济指标情况
2、企业盈利能力分析
3、企业偿债能力分析
4、企业运营能力分析
5、企业成长能力分析
四、公司优势分析
第六节 企业六
一、企业概况
二、主营产品
三、运营情况
1、主要经济指标情况
2、企业盈利能力分析
3、企业偿债能力分析
4、企业运营能力分析
5、企业成长能力分析
四、公司优势分析
第七节 企业七
一、企业概况
二、主营产品
三、运营情况
1、主要经济指标情况
2、企业盈利能力分析
3、企业偿债能力分析
4、企业运营能力分析
5、企业成长能力分析
四、公司优势分析
第八节 企业八
一、企业概况
二、主营产品
三、运营情况
1、主要经济指标情况
2、企业盈利能力分析
3、企业偿债能力分析
4、企业运营能力分析
5、企业成长能力分析
四、公司优势分析
第九节 企业九
一、企业概况
二、主营产品
三、运营情况
1、主要经济指标情况
2、企业盈利能力分析
3、企业偿债能力分析
4、企业运营能力分析
5、企业成长能力分析
四、公司优势分析
第十节 企业十
一、企业概况
二、主营产品
三、运营情况
1、主要经济指标情况
2、企业盈利能力分析
3、企业偿债能力分析
4、企业运营能力分析
5、企业成长能力分析
四、公司优势分析
【第四部分 展望、结论与建议】
第十三章 2025-2032年中国数据标注行业发展前景分析与预测
第一节 中国数据标注行业未来发展前景分析
一、中国数据标注行业市场机会分析
二、中国数据标注行业投资增速预测
第二节 中国数据标注行业未来发展趋势预测
第三节 中国数据标注行业规模发展预测
一、中国数据标注行业市场规模预测
二、中国数据标注行业市场规模增速预测
三、中国数据标注行业产值规模预测
四、中国数据标注行业产值增速预测
五、中国数据标注行业供需情况预测
第四节 中国数据标注行业盈利走势预测
第十四章 中国数据标注行业研究结论及投资建议
第一节 观研天下中国数据标注行业研究综述
一、行业投资价值
二、行业风险评估
第二节 中国数据标注行业进入策略分析
一、目标客户群体
二、细分市场选择
三、区域市场的选择
第三节 数据标注行业品牌营销策略分析
一、数据标注行业产品策略
二、数据标注行业定价策略
三、数据标注行业渠道策略
四、数据标注行业推广策略
第四节 观研天下分析师投资建议