前言
近年来,物联网、云计算和大数据的迅猛发展使得数据呈现指数级增长,智能文字识别作为文档数据管理的核心技术,迎来良好发展机遇。2022 年我国智能文字识别市场规模已超50亿元,预计2027年我国智能文字识别市场规模接近170亿元,2022-2027年年复合增长率达27.3%。
按照下游客户类型及交付形式,智能文字识别服务可分为 C 端标准化产品、B端标准化产品、B 端基础技术服务、B 端场景化解决方案四种形式。伴随下游个人用户和企业客户对文档资产数字化与智能化升级需求的驱动下,我国智能文字识别各类型细分市场均保持较高增速。从下游领域看,制造业、金融、物流等对智能文字识别技术需求较大,是智能文字识别技术的主要应用领域。
从竞争情况看,C端竞争方面,智能文字识别类主流APP中扫描全能王先发优势优势明显,处于行业领先地位。B端竞争方面,智能文字识别 B 端市场竞争参与者主要分为谷歌、百度、腾讯、阿里等综合型 AI 厂商和合合信息、ABBYY等非综合型 AI 厂商。非综合型 AI 厂商和综合型 AI 厂商有着不同的侧重领域;且细分市场竞争格局存在差别,形成B 端差异化竞争。
一、智能文字识别正确率高于传统文字识别,行业发展前景广阔
根据观研报告网发布的《中国智能文字识别行业发展趋势分析与未来前景研究报告(2024-2031年)》显示,智能文字识别是从图像中识别出文字的技术,利用机器将图像中手写或印刷文本转化为计算机可以直接处理的格式。智能文字识别能够处理不同场景的图像,包括拍摄或扫描得到的各种卡证、纸质文档图像,也包括含有文字的自然场景图像和叠加了字幕文本的视频图像等。相比传统文字识别,智能文字识别具有更强的认知能力和判别力,正确率更高,是个人数字资产管理及企业自动化办公提升的重要工具。
资料来源:观研天下整理
近年来,物联网、云计算和大数据的迅猛发展使得数据呈现指数级增长,智能文字识别作为文档数据管理的核心技术,迎来良好发展机遇。根据数据,2017年我国智能文字识别市场规模仅为6.1亿元,至2022 年我国智能文字识别市场规模已超50亿元,预计2027年我国智能文字识别市场规模接近170亿元,2022-2027年年复合增长率达27.3%。
数据来源:观研天下数据中心整理
二、智能文字识别服务内容分为四类,预计未来均保持较高增速
按照下游客户类型及交付形式,智能文字识别服务可分为 C 端标准化产品、B端标准化产品、B 端基础技术服务、B 端场景化解决方案四种形式。伴随下游个人用户和企业客户对文档资产数字化与智能化升级需求的驱动下,我国智能文字识别各类型细分市场均保持较高增速。预计2022-2027年我国智能文字识别中基础技术服务、标准化产品(C端)、标准化产品(B端)、场景化解决方案CAGR分别为16.5%、22.4%、30%、31.6%。
智能文字识别服务分类
服务 | 定义 | 产品形态 | 下游客户 |
基础技术服务 | 智能文字识别所需要基础性技术服务,通常服务于版式相对标准化的文档、证件识别 | 各类证件识别,如身份证识别、驾照识别、银行卡识别等技术授权预装,如手机授权预装等 | 下游客户主要为具有一定开发能力的企业客户 |
标准化产品(C端) | 基于智能文字识别技术所打造的标准化、可直接使用的产品 | C端产品文档管理、名片管理APP部分办公软件中也提供智能文字识别功能 | C端产品下游客户主要为C端个人消费者 |
标准化产品(B端) | 基于智能文字识别技术所打造的标准化的SaaS/PaaS产品 | B端产品面向B端的标准化产品,如名片管理企业版产品;智能文字识别各类服务相关的SaaS/PaaS产品 | B端产品对标准化SaaS/PaaS产品有需求的企业,主要为中型企业或大型企业的部分部门 |
场景化解决方案 | 基于智能文字识别技术、产品,根据客户场景化需求而开发的深度服务解决方案,以帮助B端用户实现流程数字化与智能化升级 | AI机器人,如财报分析比对、合同内容比对等AI训练平台,下游客户可自行进行智能文字识别训练 | 下游客户主要为B端大型企业目前NLP等技术在医疗领域应用(如临床决策辅助系统、病例质控系统等)较为广泛,所以目前场景化解决方案有较多医疗企业客户 |
资料来源:观研天下整理
数据来源:观研天下数据中心整理
三、金融、物流等对智能文字识别技术需求相对较大,为行业主要下游应用领域
制造业、政府、房地产、物流、医疗健康、金融企业对业务流程方面的基础信息化建设程度投入意愿相对较高,在证照、单据、表格等文档的智能录入、分类、比对、审核方面进行降本增效具有较大需求,是智能文字识别技术的主要应用领域。预计2020-2025年我国制造业、政府、房地产、物流、医疗健康、个人消费者、泛金融、其他领域智能文字识别市场规模CAGR分别为54.1%、49.4%、43.1%、36.5%、36.2%、33.8%、29.6%、25.7%。
数据来源:观研天下数据中心整理
四、智能文字识别 APP 中扫描全能王发展领先,B端细分市场格局存在差异
从C端竞争看,智能文字识别类主流APP包括扫描全能王CamScanner、Officelens、GoogleLens、ABBYY FineScanner、AdobeScan、Scannable扫描宝,其中扫描全能王已经在用户规模、品牌知名度、用户口碑等方面建立了先发优势,在文字识别 APP 领域保持行业领先地位。
文字识别类主流APP基本情况
APP | 简介 | 上线时间 | 用户数量 | 用户体验 |
扫描全能王CamScanner | 将智能手机变成便携式扫描仪,采集、管理各种文档产品,支持文档图片的智能切边、智能图像增强、票据/证照/表格等多种文档的文字识别功能 | 2010 年 | 2023 年的平均月活为 14,540.4 万 | iOS 中国区评分 4.9,评分个数 450.6 万个iOS 美国区评分为 4.9,评分个数 126.3 万个 |
Officelens | 微软集团旗下的扫描与文字识别产品,可将图像转换为 PDF、Word、PowerPoint 或 Excel 文件,将打印或手写文本数字化 | 2015 年 | 2023 年的平均月活为 1,269.6 万 | iOS 中国区评分 4.9,评分个数 3.1 万个iOS 美国区评分为 4.8,评分个数 10.7 万个 |
GoogleLens | 微软集团旗下的扫描与文字识别产品,可将图像转换为 PDF、Word、PowerPoint 或 Excel 文件,将打印或手写文本数字化 | 2017 年 | 2023 年的平均月活为 2,488.1 万 | Googlelens未在 AppStore 上架 |
ABBYY FineScanner | ABBYY 集团旗下开发的产品,可从扫描内容中提取文本进行进一步编辑和共享 | 2012 年 | 2023 年的平均月活为 4.1 万 | iOS 中国区评分 4.8,评分个数 0.7 万个iOS 美国区评分为 4.7,评分个数 1.9 万个 |
AdobeScan | Adobe 集团旗下开发的扫描与文字识别产品,能够将任何纸质文档转换为AdobePDF,同时具备 OCR 功能 | 2017 年 | 2023 年的平均月活为 6,623.6 万 | iOS 中国区未上架iOS 美国区评分为 4.9,评分个数 123.6 万个 |
Scannable扫描宝 | Evernote 印象笔记旗下的扫描与文字识别产品,可将纸质文件扫描成图片,并支持 OCR 文字识别,可无缝对接至印象笔记 | 2010 年 | 2023 年的平均月活为 48.9 万 | iOS 中国区评分 4.9,评分个数 13.0 万个iOS 美国区未上架 |
资料来源:观研天下整理
从B端看,智能文字识别 B 端市场竞争参与者主要分为谷歌、百度、腾讯、阿里等综合型 AI 厂商和合合信息、ABBYY等非综合型 AI 厂商。
综合型 AI 厂商旗下云平台提供的 B 端服务范围广泛且多元,包含云服务器、云存储、云数据库、人脸识别、语音识别、视频分发加速等相关产品,智能文字识别仅为其中一种产品。综合型 AI 厂商切入 OCR 领域的主要原因是:基于其成熟的公有云 PaaS 平台提供基础化、标准化的 OCR 识别服务的边际成本较低,拓展 OCR 业务的主要目的是进一步提升其云平台服务的丰富度。但拓展场景化的解决方案市场需大量人力、研发投入配合客户的个性化需求,项目周期也较长,边际成本较高。而非综合型 AI 厂商核心业务即为智能文字识别,但其在智能文字识别业务投入的人员与资金较为有限。
非综合型 AI 厂商和综合型 AI 厂商有着不同的侧重领域,形成B 端差异化竞争。
智能文字识别B 端市场竞争参与者分类及其基本情况
类别 |
侧重领域差异化 |
公司名称 |
公司简介 |
在智能文字识别领域的产品/服务 |
综合型 AI 厂商 |
智能文字识别不是其主要核心业务 |
百度云 |
又称“百度智能云”,是百度集团旗下的云服务平台,创立于2015年。其专注云计算、智能大数据、人工智能服务,提供云服务器、云主机、云存储、CDN、域名注册、物联网等云服务。 |
智能文字识别是百度云平台提供的能力之一,以提供API/SDK标准化PaaS产品为主:近年开始布局场景化解决方案,2020年推出智能文字识别平台TextMind:2021年上线EasyDLOCR智能文字识别模型自训练平台。 |
腾讯云 |
是腾讯集团旗下的云服务平台,2013年创立。其提供云计算、大数据、人工智能服务,涵盖云服务器、云数据库、云存储、视频与CDN、域名注册等全方位云服务和各行业解决方案。 |
智能文字识别是腾讯云平台提供的能力之一,以提供API/SDK标准化PaaS产品为主。 |
||
阿里云 |
是阿里巴巴集团旗下云服务平台,创立于2009年。其提供云服务器、云数据库、云安全、云企业应用等云计算服务,以及大数据、人工智能服务、精准定制基于场景的行业解决方案。 |
智能文字识别是阿里云平台提供的能力之一,以提供API/SDK标准化PaaS产品为主。 |
||
Google Cloud |
是Google 集团旗下的云计算服务平台。其提供云计算、数据存储、数据分析等一系列国际化的云服务。 |
Google Cloud平台以提供API/SDK标准化PaaS产品为主,较少提供场景化解决方案。另外Google在C端APP有Google Lens产品。 |
||
非综合型 AI 厂商 |
智能文字识别是其主要核心业务 |
ABBYY |
1989年创立,是一家提供PC和移动设备OCR、文档识别软件和计算机辅助语言学习软件的国际软件公司。ABBYY在世界各地通过区域和国际合作伙伴的广泛网络,产品已远销130多个国家。 |
B端服务方面包括基础技术服务、标准化服务、场景化解决方案,客户以国外客户为主,C端产品包括ABBYYFineScanner、ABBYYBusiness Card Reader。 |
合合信息 |
公司成立于 2006 年。2016年公司将深度学习算法、自然语言处理技术与 OCR 技术相结合,自主研发智能文字识别技术,大幅度提升了智能文字识别技术的性能和应用场景,并将 AI 技术落地成为产品级应用。 |
在 B 端业务方面,2016 年,公司正式成立企业级智能解决方案事业部,面向行业头部客户,输出超过 100 种证照的 OCR 基础模块服务,布局文字识别 B 端企业服务领域。2017 年开始,公司针对不同行业复杂场景的文字识别进行更多元化的商业化探索,加速布局智能文字识别 AI 机器人、AI 训练平台等场景化解决方案。在 C 端产品方面,公司在 2010 年把握住了移动互联网的高速发展机遇,上线了名片全能王、扫描全能王两大产品,目前已在用户数量、用户体验、核心技术等方面独特的竞争优势。 |
资料来源:观研天下整理
智能文字识别 B 端服务不同细分市场的竞争格局存在差异。基础技术服务市场参与者较多,包含智能文字识别厂商、传统文字识别厂商、云服务平台厂商等。基础技术服务存在一定程度的同质化竞争。
标准化B端产品处于发展早期,由于打造标准化SaaS(软件即服务)、PaaS(平台即服务)产品的技术门槛较高,目前仅有少数企业布局,目前主要参与者为合合信息(提供SaaS产品服务)、少数云服务平台(如阿里云、百度云、腾讯云等,提供PaaS服务)
由于场景化解决方案通常需要于客户现场进行实施部署,因此具有区域性,市场分布较为分散。国内几大云平台服务厂商及部分AI企业开始布局场景化解决方案,但是由于行业理解及业务场景落地能力需要长时间的经验积累,目前商业化落地案例较为有限。
B 端服务不同细分市场的竞争格局
B端细分市场 | 竞争情况 |
基础技术服务 | 基础技术服务市场参与者较多,包含智能文字识别厂商、传统文字识别厂商、云服务平台厂商等。基础技术服务存在一定程度的同质化竞争。 |
标准化B端产品 | 标准化B端产品处于发展早期,由于打造标准化SaaS(软件即服务)、PaaS(平台即服务)产品的技术门槛较高,目前仅有少数企业布局,目前主要参与者为合合信息(提供SaaS产品服务)、少数云服务平台(如阿里云、百度云、腾讯云等,提供PaaS服务) |
场景化解决方案 | 由于场景化解决方案通常需要于客户现场进行实施部署,因此具有区域性,市场分布较为分散。国内几大云平台服务厂商及部分AI企业开始布局场景化解决方案,但是由于行业理解及业务场景落地能力需要长时间的经验积累,目前商业化落地案例较为有限。 |
资料来源:观研天下整理(zlj)
【版权提示】观研报告网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至kf@chinabaogao.com,我们将及时沟通与处理。