未来AI产业走向求解,大模型加持的数字人能否成就大业?

作者:小编 更新时间2023-10-13 11:23:25 点击数:

在杭州举办的第19届亚运会,刚刚拉下帷幕。如果说与往届亚运会相比,本届亚运会最大的亮点是什么?那非是数字人技术在亚运会期间的广泛应用莫属。

先是在开幕式上,首次出现了“数字人点火”,由全球超过1亿位线上用户参与,共同组成的一个巨大的“数字火炬手”,如蜻蜓点水般跑过钱塘江江面,奔进主会场,跟现场火炬手一同点燃主火炬,引发了广大网友的赞叹和好奇。

作为人工智能、裸眼3D和现实增强技术的完美合体,这一次“数字人点火”,不仅开了大型运动会点火仪式数字化的先例,同时也让数字人技术成为近期全球业内外各界热议的话题。

“数字人”并非新事物,降本增效是“老江湖”

虽说近几年,数字人才大量出现在人们生活中,但其本身并不是近几年才出现的新事物。其实,世界上第一个数字人问世,距今已有近60年了,而且在这几十年时间里,它们一直在为我们服务。

早在上世纪60年代,波音公司就在飞机设计领域,开始使用一款名为“波音人”的数字人来充当人体工程学研究的人体模型。“波音人”不仅拥有人类的外形和常见的行为举止,而且还能在人类设计的场景中模拟人的动作,甚至能跟外界进行交互并生成数据。基于这些数据,设计师们可以对飞机驾驶舱设计做人体工程优化,以便飞行员在驾驶飞机时,能操纵得更加得心应手。

此外,在汽车行业,数字人也很早就得到了应用。其中,很多车企就在汽车碰撞安全测试中引入了数字人技术。比如,丰田汽车就曾经开发过一款人体建模软件“THUMS”。通过这款软件,能够构建出非常接近人类外形、行为和反应,且具有不同性别、年龄、体型的“数字人”司机或乘客。用其做碰撞测试,不仅能收集到更加全面的信息,还能在确保测试效率和准确性的同时,最大限度降低测试成本。

可见,对于产业界而言,数字人本身并不新鲜,真正新鲜的是随着成熟人工智能技术的加持,数字人实现了智能化。而今天的数字人,也已经从早期的对于人类外形和行为动作的单向模仿,升级为对于人类思维模式的模仿、内容生成和交互输出。

今“数字人”非彼“数字人”

近两年,随着生成式AI技术的高速发展和应用普及,我们已然走进了与数字人共同生活的时代。从技术层面来讲,今天的数字人跟早期的类似于“波音人”的数字人相比,还是有很大的区别的。

波音和丰田所开发的数字人,基于应用角度来看,只能算是用来做数据采集的模拟人体,顶多算是一种简单的人的数字孪生,说是数字人就显得有点牵强。

就定义而言,按照中国人工智能产业发展联盟发布的《2020虚拟数字人白皮书》中的描述,虚拟数字人必须要满足以下三个标准,即一要拥有2D或3D的人类外观;二要拥有如语言、表情、动作等的人类行为;三要拥有人类的思想,比如识别、交互等能力。

而按照这个标准,像“波音人”、用丰田“THUMS”软件打造的数字人,就不能算作数字人,因为它们不仅没有人的外观和行为,也不能识别外部环境且与人交互。而今天的数字人,则能够具备逼真人类形象和人工智能。

比如,利用AI语音生成技术和逼真的表情、动作生成技术,能让数字人在交流、演讲和播报中更富有表情和感染力,另外通过大语言模型的加持,也让数字人具备了可以根据用户留言而给予相应回应的能力,而“数字患者”、“数字健康顾问”的出现,也让数字人能为用户提供仿真的医疗场景。

自2022年起,国内很多企业就已经成为智能客服技术应用的“弄潮儿”,开始“雇佣”数字人员工了。当你在线跟企业客服人员沟通,或者登录企业线上营业厅,办理各项业务的时候,在另一边跟你对话打交道的,就很有可能是一个数字人。

在今年7月举办的“2023世界人工智能大会”期间,上海市经信委、上海市产业技术创新促进会联合深兰科学院共同发布了国内第一份《2023数字智能产业系列报告:个人数字化》白皮书。该白皮书就提出了数字人的发展分为内容数字化、人的数字化和生命数字化三个阶段,并从个人的数字交互、数字孪生、数字存储这三个维度,展望了数字人产业发展的前景。

由此可见,今天的数字人产业,俨然已经站在了数字经济产业舞台的C位。

近阶段爆火的“数字人”,你都知道哪些?

在AI科技迅速发展的大环境下,数字人作为典型代表产物,其商业化也进入了快车道,众多科技企业纷纷入局。根据企查查数据显示,目前国内与数字人产业相关的企业,数以十万计。产品大致可以按应用、技术、呈现方式三个层面划分,总计七大类;如按属性划分,则可分为

image

从应用层面,数字人主要分为服务型、表演型和身份型三大类。

其中服务型数字人强调的是功能属性,主要是为大众提供各种服务,如虚拟客服、主播、导游等,也包括具有陪伴、关怀价值的虚拟助理、顾问等,基本面向B端客户,主要起降本增效、助力营销的作用。

如2022年,商汤科技为宁波银行专门打造的数字员工“小宁”,就属于这一类数字人。据介绍,“小宁“是基于商汤原创的“虚拟IP解决方案”及多种领先的AI技术打造的,可以自主从事直播、运营及互动,实现了全天候的“用户触达”。而深兰科技为武汉江汉路步行街智慧化升级项目打造的数字主理人“江妮”也属于这一类。

表演型数字人强调的是偶像属性,当前主要是被应用在娱乐、社交、办公场景中,如各类虚拟偶像、明星虚拟分身等,相较于服务型数字人,其更具流量吸引力和商业想象空间。

在今年大年初一《广东卫视春节晚会》上,与钟镇涛、炎明熹一同演唱歌曲《财神到》的陈水若,就是基于AI平台“小冰框架”生成的一位擅长中国风曲目的AI数字歌手。

而身份型数字人则是强调身份属性,即现实世界中的“真人”在虚拟空间、元宇宙中的ID,也被称为个人数字分身。不同于前两种数字人,身份型数字人主要面向个人用户,其瞄准的也是最具市场想象力的个人数字化产业,当前主要用于社交、办公等场景,未来具有广阔的应用场景和发展前景。

在前不久召开的“ 2023‘科创的力量‘无疆首届高新科技产业资本峰会”上,宣布在全国范围内招募合伙人的“深兰硅基大脑SaaS平台”,就是深兰科技基于硅基知识大模型开发的一款服务于个人数字化的数字人生成产品,它可以记录个人的日常数据,并用于数字人的领域知识和个性化人设等高维定制化训练。用户通过该平台快速构建的ChatGPT级别AI数字人,就属于身份型数字人。

从技术层面,数字人则可以分为真人驱动型和智能驱动型两大类。

真人驱动型数字人是采用“CG建模+真人动作捕捉”方式构建,在完成建模和关键点绑定后,数字人可以通过设备捕捉真人的动作、表情、语言等,并以此为驱动,完成相应表演、互动。其可以看作是传统影视制作CG技术的延续,强调“人机耦合”,技术相对成熟,尤其随着近些年算法进步以及高清动作捕捉设备的使用,攻克了在稳定流畅地捕捉和展示真人微表情、微动作上的技术难点,这使其成为当前最常用数字人。如使用腾讯智影视频生成平台塑造的数字人,就是属于这一类。

智能驱动型数字人,则是依托多模态大模型技术来驱动眼、眉、嘴等人体部位,以此让数字人展现出比肩真人的动作、表情乃至记忆、思想等,形成独特“人设”和技能,自主完成内容输出以及与外界互动。该类数字人主要基于知识图谱进行服务,目前大都以“工具人”身份出现,例如虚拟客服、虚拟助手、虚拟导游等。

单就技术而言,由于完全智能驱动型数字人在人设、思想、记忆及主动互动与输出等方面,有着很高的技术要求,因此开发这一类数字人的平台,大都还处于技术攻坚阶段,只有少数企业取得了突破性进展,而那些真正有部分认知能力且可实现智能交互的数字人,也是最近才开始商用的。前面提到的通过“深兰硅基大脑SaaS平台”打造的数字人,如果按技术层面来划分,也可以划归这一类。

从呈现方式层面,虚拟数字人主要分为卡通型和超写实两类。

卡通型数字人突出的是虚拟属性,其虽然具有语言、动作、表情等人的行为模式,但它的一切皆为虚构,在现实世界中根本不存在。这一类数字人其实从动画影视出现那天,就已经出现了,它的优势主要体现在易制作、产量大、成本低上。因此,目前这一类数字人主要还是出现在二次元、游戏、卡通动画中。

而超写实数字人突出的则是数字资产属性。作为当前数字人主流发展方向和未来个人链接元宇宙场景的重要工具,其从一开始就绕开了“二维”和“卡通”,通过精细设计并由技术合成,且自带高清人物建模以及专属服饰和场景,为的就是尽可能贴合现实世界中的真人形象。

如在2月召开的“2023全球人工智能开发者先锋大会”上,以AIGC首席架构师身份发表演讲的百度AI数字人希加加;使用商汤“如影”平台打造的个人数字分身;用户通过每经科技自主研发的“雨燕智宣”平台生成的数字主播等,都属于超写实数字人。

而如果按照产品属性来划分的话,则可以分为成品和工具平台两大类。像AI歌手陈水若、百度AI数字人希加加、宁波银行数字员工“小宁”等属于成品类产品,而像“商汤如影”、“深兰硅基大脑SaaS平台”、每经“雨燕智宣”这样的,则属于是工具平台类产品。

image

数字人和数字人生成平台举例

“数字人”脱胎换骨,“数智人”呼之欲出

总的来说,国内数字人产业目前正处于加速发展期,越来越多的科技企业在这一领域布局,越来越多的数字人产品在各行各业落地,整个产业呈现出一片欣欣向荣的发展局面。据前瞻经济学人预计,2027年市场体量或达到300亿元,2022-2027年行业整体年复合增速或达到30%。

当前,AI技术驱动多模态输入感知、多模态交互能力不断完善,ASR、NLP、TTS、STA、情感计算等技术已经取得突破,数字人已经开始担负起连接人与AI的新型交互接口的角色,成为元宇宙中各类“人”与事物之间产生联系或发生孪生关系的新介质。

因此,像虚拟IP与虚拟化身这两类身份型数字人,它们在内容创新空间和应用开发潜力上的优势将更加明显,有望在电商、直播、营销等领域得到广泛应用。

未来,随着数字人所具备的人的形象、性格、行为特征以及类人的互动能力不断提升,大模型技术的不断加持,数字人将进一步向具有人类意识的“数智人”方向发展。在不改变业务逻辑的情况下,“数智人”可以与更多的行业场景进行深度结合,产生千行千面的数字人业态,从而向用户提供更好的陪伴。

总而言之,虽说现阶段数字人产业仍处于发展初期,但未来随着技术的突破、应用门槛的降低,市场体量的增大,数字人必将走进我们的生活,走进千家万户。

正所谓:一切皆有可能,万事皆可期待。

Tag: AI产业 大模型
首页 资讯 AI写作 我的