1、AI虚拟人产业链包含基础层、平台层、价值层、交互层
随着AI产业快速发展,赋能虚拟人行业蓬勃发展。目前,AI虚拟人产业链包含基础层、平台层、价值层、交互层,其中底层软硬件水平是决定AI数字人发展的技术基础,AIGC赋能平台层,为虚拟人生成提供多样化的工具,终端硬件将直接影响用户的交互体验。
AI虚拟人产业链
数据来源:观研天下整理
2、虚拟人可分为L1-L5阶段
根据虚拟人的自动化水平,可分为L1-L5阶段,其中L3阶段虚拟人依赖算法驱动肢体、姿态等拟人化特征,而AI推动虚拟人智能化水平提升,实现虚拟数字人向L4、L5层级迈进,业务价值、自动化水平大幅提升。
AI赋能虚拟人产业
数据来源:观研天下整理
3、AI虚拟人多模态交互能力大
根据观研报告网发布的《中国AI虚拟人行业发展趋势分析与投资前景研究报告(2023-2030年)》显示,AI数字人是指数字人的语音表达、面部表情和动作形态等通过深度学习模型进行运算,将其结果实时或者离线驱动,并进行渲染。目前,虚拟人接入大模型以文本交互为主,通过ASR-NLP-TTS等AI技术进行转化,实现数字人感知、决策、表达等层面的交互,自然语言大模型与虚拟人的融合还需进一步完善。
AI虚拟人交互场景
类别 |
技术 |
阶段 |
作用和目的 |
发展趋势 |
语音理解 |
ASR |
感知阶段 |
将人的语音转化为文本 |
相对成熟 |
NLP |
决策阶段 |
处理并理解文本,以对话能力为核心,为数字人的大脑 |
配合知识图谱,应用于特定场景,未来通用型模型还需要完善 |
|
TTS |
表达阶段 |
将需要输出的文本合为语音 |
相对成熟,未来方向增加断句、多音字的准确度,增加情感,更加似人 |
|
动作合成 |
AI驱动嘴型动作 |
表达阶段 |
建立输入文本到输出音频与输出视觉信息的关联映射,主要对采集到的文本到语音和嘴型视频(2D)/嘴型动画(3D)的数据进行模型训练,得到相关模型,并智能合成。 |
随着写实度的提高,微表情更多,超写实对精度要求更高,还需进一步完善 |
AI驱动其他动作 |
表达阶段 |
动作是采用随机策略或者校本进行预设,需要人工配制描述性的数据或标签 |
尚未实现智能合成 |
数据来源:观研天下整理
4、虚拟人产业快速发展,AI虚拟人市场前景广阔
2023年,在元宇宙概念爆发及AI大模型相继发布,虚拟人产业快速发展,实现多环节降本增效,大幅提升应用端交互能力,进而将带动AI虚拟人行业发展,未来市场前景广阔。根据数据显示,2022年我国虚拟人核心市场规模达120.8亿元,同比增长94.2%,带动市场规模为1866.1亿元,同比增长73.6%;预计2025年我国核心市场规模有望达到480.6亿元,2025年带动市场规模有望达6402.7亿元,同比增长33.8%。
数据来源:观研天下整理
数据来源:观研天下整理
5、AI虚拟人兴起,有望成为生成式AI的重要应用场景
具体从各大AI模型来看,随着大家对AI虚拟人关注度持续提升,相继出现相关产品和商业模式落地,AI虚拟人将会成为未来AI和元宇宙结合的直接应用,提升全社会的生产效率,创造更大应用价值。
近期我国AI虚拟人相关事件
事件 |
简述 |
AI孙燕姿全网走红 |
在B站上,AI孙燕姿翻唱的林俊杰「她说」、周董「爱在西元前」、赵雷「成都」等等较为逼真,引发全网的关注 |
美国女网红用AI分身交友,实现按分钟计费 |
23岁的女网红用GPT-4复刻了一个自己后,已经周入7万多美元。这位叫做Caryn Marjorie的网红,根据自己2000个小时的YouTube视频,训练出了一个语音聊天机器人,AKA「虚拟女友」 |
数据来源:观研天下整理(WYD)

【版权提示】观研报告网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至kf@chinabaogao.com,我们将及时沟通与处理。