【融合论坛】AI“淘金”,数字人跃立潮头
点击蓝字 关注我们
目前,AI数字人在直播、娱乐等诸多行业已经得到广泛应用且日渐成熟,已经可以实现高精度的表情模拟、语音合成及实时对话等复杂功能,如虚拟主播、虚拟偶像等角色的数字人,能够实现流畅的实时互动、个性化内容生成。
“一位时尚女性走在充满暖色调霓虹灯和动画城市标牌的东京街道上,她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包……”不久前,Sora根据这些文字提示生成的一段60秒视频一经流出便被全网刷屏。毫无疑问,继微软将AI融入搜索引擎Bing和云平台Azure、向用户开放加入AI功能的办公软件辅助产品Microsoft 365 Copilot后,Sora这种强大的文生视频能力所涌现出的巨大商业潜力再次引发了极高的关注度,让整个业界为之沸腾。
目前来看,Sora对内容创作工作流产生的颠覆效果尚需一些时日才能显现,相比之下,近年来火热的AI数字人却是已经实实在在地达成了商业化落地目标,产生了肉眼可见的经济效益,成为当下名副其实的热门赛道。在AI“淘金”热潮下,跃立潮头的数字人将如何自持,又将何去何从?
技术“搭台”,数字人“唱戏”
数字人也称虚拟人,从20世纪80年代开始萌芽,“数字化”的特征在这个阶段并不明显,打造虚拟人的技术以手工绘制为主,人物形象以2D卡通的形式为主,展现方式以事先完成的音频和视频为主,并不具备实时交互功能。跨入21世纪,虚拟人的“数字化”特征逐渐明显,得益于CG(计算机动画)和动作捕捉等计算机技术的进步,影视作品中出现了3D数字角色,数字人发展进入了第二阶段。最近10年,缘于深度学习算法的突破,AI生成的第三代虚拟角色问世,其外形更接近真人,可以按脚本讲话做事,AI数字人自此崭露头角。
纵观数字人的演变,其进化历程大抵与现代技术革命发展一脉相通,二者的演进始终紧密地交缠在一起,犹如一场呈现在世人面前的精彩戏曲,场下“搭台”的是技术,而场上“唱戏”的则是数字人。
受早期技术发展所限,第一代数字人技术依赖于昂贵的动作捕捉设备,第二代数字人技术只能对视频人物的口型进行修改。这两代数字人勉强能用“徒有颜值”描述,缺少完整的“人格”,但在最近一年AIGC技术的加持下,这些缺口或将被补上,为数字人注入“灵魂”。在赛迪顾问人工智能与大数据研究中心研究员白润轩看来,AI技术,尤其是多模态AI的突破性发展,为数字人带来了革命性的变化,它不仅让虚拟形象在视觉呈现上更加真实细腻,而且通过语音识别、语义理解、情绪模拟等技术手段赋予了数字人更深层次的智能与情感表达能力,使得数字人能够进行更为复杂和自然的人机对话,增强用户的情感共鸣和沉浸体验。
图 跳悦智能南山智慧运营AI数智礼宾南晓智
对此,跳悦智能创始人、CEO包英泽也认为,大模型的出现确实让数字人更加拟人化、个性化,变得活灵活现。相比之下,在AI大模型出现之前,数字人更像是一个复读机,仅有少数的商业化功能,完全没有“灵魂”。生成式AI技术的发展也让数字人创作的周期大大缩短,如今仅需几张照片和几分钟语音素材创作出来的数字人,在效果上就能媲美几年前需要数小时素材采集得到的数字人模型。
不可否认,AI技术的进步确实让数字人表现得更加像“人”,但对于一些人提出“AI拯救了数字人”的说法,广州赛灵力科技有限公司CEO付玟却有着不同的观点:“数字人的发展天然需要建立在AI技术之上,AI技术本就是数字人发展的底层技术之一,AI发展得越好,数字人自然也会越好。多模态AI的发展对于数字人的用户体验和市场接受度的提升都有非常大的帮助,但这不算是一种‘拯救’,而应该说是AI先进技术对虚拟人行业的一场赋能。”
在此方面,联通在线广州公司元宇宙发展部副总经理张帆的看法与付玟博士有些许相似:“大模型技术和行业模型的进一步丰富和完善,使得数字人的交互和服务不再是简单的对话,它能够帮助数字人根据具体的服务场景提供全天候拟人式的多轮对话、咨询交互服务,大幅提升服务质量和效率。AI技术进一步拓宽和丰富了数字人的应用场景,特别是有助于交互式数字人的推广和普及。”
热潮涌动,AI数字人实力“出圈”
近年来,在一波接一波的AI投融资热潮催动下,各类AI应用如雨后春笋般涌现,AI数字人作为其中一员更是得到了众多用户的青睐。打开电视,气质端庄、容颜姣好的虚拟主播正在播报新闻节目,不仅表达精准连贯,还能进行手语直播;走进剧场,虚拟偶像正式亮相,与众多演员一道同台竞演;进入购物直播间,妆容精致的虚拟主播永远元气满满地推销着自家产品……当这些虚拟的形象被AIGC赋能时,AI数字人应用便有了一条明确的商业化道路。
应用概况
艾媒咨询(iiMedia Research)发布的《2023年中国AI数字人产业研究报告》显示,目前,AI数字人行业客户对数字人主要产品类型的需求是数字员工与定制化数字人,企业对产品需求越发偏向个性化定制与高效率服务。当这些需求投射到具体领域,我们便看到了AI数字人当下在电商、文娱等行业的集中爆发。
“目前,AI数字人在直播、娱乐等诸多行业已经得到广泛应用且日渐成熟,已经可以实现高精度的表情模拟、语音合成及实时对话等复杂功能,如虚拟主播、虚拟偶像等角色的数字人,已经能够实现流畅的实时互动、个性化内容生成等功能。”当谈及AI数字人的应用情况时,白润轩如是说。
作为一线从业者,付玟认为,从原则上来说,AI数字人可以应用于各行各业,但实际应用需求有多大、应用水平如何,还要看AI数字人对这个行业而言是不是刚需。此外,各行业企业的管理者对于AI数字人的认知、判断和接受程度,以及愿意去尝试AI数字人这个新事物的欲望,也都起着非常关键的作用。
“在还原度、逼真度、自然度等方面,AI数字人与真人相比或多或少有一些差别,肯定替代不了真人,但它可以很好地做真人的辅助,如AI虚拟直播、AI虚拟导游就是很好的辅助应用,也是我们开拓市场的重要领域。除此之外,赛灵力还实现了AI数字人在医疗、教育等行业的落地,推出的AI虚拟医生可以用于医院前台导诊、诊后随访、心理咨询、心理测评等,AI虚拟教师可以和学生互动、回答学生提出的疑问、进行课后交流。”付玟补充道。
同为AI数字人商业赛道的“淘金人”,MLC产业研究室负责人、跳悦数字传媒合伙人林海燕则指出,根据市场调研反馈情况来看,AI数字人行业应用的广度和深度与其在具体场景下带来的降本提质增效效果密切相关,某些行业(教育教学、新闻制作、电商直播、礼宾接待、品牌营销等)在此方面天然地具有优势,用户借助AI数字人可以快速达到预期的应用目标。
图 跳悦AI数智官
(此形象由“跳悦AI百变画像“产品生成)
“以电商直播带货为例,在新消费浪潮下,AI数字人这种新颖、低成本的宣传手段非常契合行业需求。2021年上半年进入市场时,跳悦智能推出的第一款成熟的AI数字人应用就是面向电商领域的,而且是批量化的应用,在我们服务的众多电商客户中也收获了诸多好评。后续受限于部分平台的一些规则和管控措施,AI数字人应用在公域直播领域受到了一些影响,但在精于运营的品牌型电商直播间,私域直播的转化率却非常好。”林海燕谈道,“山东某琉璃产业带的一家电商企业使用我们的AI数字人做纯私域直播,在没有真人主播的情况下实现了直播间月均销售额达到8~10万元。现在,我们已从电商直播带货服务延展到本地生活直播服务,并积极开拓新的市场,以‘品牌资产打造’为核心帮企业打造专属AI数智官,对形象进行职能标签赋予、人格赋予,结合自身的产业内容能力进行长期可持续的内容运营,将品牌专属的AI数智官打造成真正的IP。而AI数字人‘这张皮’背后的数字化服务及基于大模型能力的私有化部署,则是我们重要的战略性业务布局。”
商业模式
产品是企业的核心竞争力之一,商业模式是企业长期发展的关键,AI数字人产品/技术服务商们想站稳脚跟、开拓市场也免不了要精心打磨自己的商业模式,并将其推向市场,接受洗礼和考验。
联通在线广州公司公众产品BU总监刘峰认为,目前,AI数字人的使用方式仍然以平台型工具模式为主,国内多家AI数字人公司提供的是数字人形象定制、主播、直播标准化平台服务,主要的商业营收模式是获取平台使用服务费。
“具体到商业模式层面,赛灵力遵循的是两种模式并行。一是面向直客,我们将产品直接卖给终端客户,收取定制费、服务费;二是代理商模式,合作代理商在我们这边充值后将我们的AI数字人产品售卖给众多的终端客户。相较而言,代理商模式是主要模式,这与我们将自身定位为一家数字人工厂紧密相关。”在接受本刊记者采访时,付玟也详细阐述了赛灵力的商业运作方式。
无独有偶,在商业运作上,跳悦智能也尝试采用了代理商模式。据林海燕介绍,跳悦智能早期是按区域进行代理商划分的,这种模式较为传统,而目前更多的是从产业生态的角度出发对渠道伙伴进行分类,细化各垂类领域的代理运作,同时也在不断将自身产业空间载体、产业公共服务平台的能力和资源与数字人深度融合,努力做到“产业项目走到哪里,应用场景就覆盖到哪里”,从物理空间招商到特色内容打造,为城市区域品牌建设和园区系统化运营提供AI数智化实用解决方案。
争议缠身,发展面临新困境
有风口的地方就会有争议,在AI数字人赛道热度持续攀升的背后,无数争议、质疑也扑面而来。在新困境下,AI数字人该如何脱身?
套壳
AI数字人的火热挑动了无数人的神经,一些投机者开始蠢蠢欲动,寄希望于通过套壳的方式在市场中浑水摸鱼,实现不当得利。对于这种投机取巧的商业行为,白润轩从研究者的角度出发,建议做AI数字人的企业要鼓励真正的技术创新,投入研发资源来提高AI的理解和生成能力,确保自家的数字人能够提供有深度的交互体验,避免被别有用心者轻易模仿。
站在从业者的角度,付玟也坦言,被套壳这种情况无法100%避免,只能通过一些手段加以规避,赛灵力在筛选代理商时会对其资质和客源情况进行严格核实,也会在产品代理充值额度上设置“门槛”,尽量保护自身的知识产权和商业信誉不受损。
AI幻觉
为了在激烈的市场竞争中寻得立锥之地,提供更好的客户服务体验,一些AI数字人服务商开始给自家的产品接入大模型,但由此也引出了一个不得不面对的现实问题—如何避免产生AI幻觉?若处理不当,可能会适得其反。
针对此问题,包英泽直言道:“严格来说,AI幻觉是无法完全避免的。如果客户所属的行业对于这块完全无法接受,短期内的建议是不要让数字人产品接入大模型。为了解决这个问题,跳悦智能也正在研发对各类大模型进行幻觉测试的系统,以提供给客户在统计意义上最优的产品。通过AI模拟各种场景,评估逻辑模块、提示工程和SFT(监督微调)等模块对产生幻觉的影响。在实践中,我觉得可能会有约千分之一的概率出现这种轻微的幻觉。”
面对这个棘手的问题,付玟也给出了自己的意见:“一是加强对大模型反馈答案的风控监管,对于一些可能造成幻觉的答案,通过人工+技术审核的方式,及时将它扼杀在‘摇篮’里或者直接就不让它返回。二是可以打造专属的私域大模型,构建专业的知识库,以降低在特定领域应用时出现幻觉的概率。”
伦理与合规挑战
CoCo(李玟)坐在镜头前和观众打招呼,视频和声音却由AI生成,去世的她突然被“数字永生”。除了李玟,同时被数字还原的还有乔任梁、张国荣、高以翔等离我们远去的公众人物,而在相关视频的评论区,有人打着温情的名义,趁机做起AI推广、收费服务营销……
已故名人被AI“复活”,在满足部分亲人或粉丝情感慰藉的同时,也触及名人肖像权保护、名人近亲属精神利益免受侵犯等现实问题。由点及面来看,这也将是AI数字人发展过程中无法回避的普遍性问题,需要妥善处理,若由此引发旷日持久的口水战甚至民事诉讼,对于整个行业发展产生的不良影响将是灾难性的。从众声喧嚣中寻求多数共识是当务之急,对此,白润轩在接受采访时提出了一些建议。
在伦理层面,应推动建立严格的伦理审查制度,在尊重个人隐私和感情的基础上慎重考虑技术使用的边界,同时进行充分的社会讨论和制定法律法规,确保相关服务不会造成心理伤害和社会伦理混乱。
在合规层面,服务商不仅需要在创作虚拟形象时确保原创性和合法性,避免模仿现实人物;还要在商业化运作中严格遵守法律法规,取得必要授权,并按照广告法等相关规定开展商业合作。
蓄势谋划,奔向未来
不谋万世者,不足谋一时;不谋全局者,不足谋一域。AI数字人的发展已日渐成熟,未来也不免会经历惨烈的“淘汰赛”,要生存、要图强,入局者们需要审视当下,面向未来,寻求突围新方向。
基于深厚的行业积累与实践经验,张帆判断,未来,AI数字人在固定化、结构化、模块化类型的服务及趣味、娱乐等工作中,可以在很大程度上将人类从巨量的工作中解放出来,能够替代真人提供更加精准到位的服务,并且可以实现快速上岗,从业者们可以在这些方向提前谋划布局,把握发展机遇。
对此,包英泽则表示:“在AIGC的赋能下,我们的产品不断迭代。跳悦智能的产品和市面上其他数字人相比,差异体现在个性化、智能化和平民化方面。个性化指让每个用户都能创作自己独一无二的数字人形象和声音;智能化指提供给客户幻觉概率符合预期的数字人大脑;平民化指让每个用户都能像玩电脑游戏一样简单地使用数字人产品。目前,跳悦智能推出的AI数字人产品和服务已经实现了‘千人千面’。未来,在个性化、智能化、平民化的产品定位战略的指引下,我们将迈入新的阶段,致力于研发新一代能将人物、光影和背景场景紧密融合的AI数字人,给用户提供在MR世界深度沉浸的数字人体验。”
而据付玟介绍,在数字人的发展布局上,赛灵力是按照1.0、2.0、3.0、4.0这样的阶段性战略分步走的。从1.0阶段的视频口播数字人,到2.0阶段的直播交互数字人,再到目前3.0阶段正重点打造的互动性更强、形象更加逼真和自然、拥有私域大模型大脑的互动虚拟数智人,赛灵力投注了大量资源。在未来的4.0阶段,赛灵力希望推出接入AI Agent(智能体)的数字人,即智能体数字人,它能够在更高水平互动的基础上,深刻洞察用户的需求,解决生活中的实际问题,带来一些价值更高的服务。
条条大道通罗马。技术路线、发展战略虽千变万化,但大家对于AI数字人的期盼普遍都是美好的。未来,AI数字人将如何挣脱枷锁、高质量演进、实现全面的商业化应用,我们翘首以待。
刊载 |《软件和集成电路》杂志2024年4月刊
作者 | 本刊记者 陈连虎
美编 | 陈蒙蒙
相关阅读
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 1 重温习近平主席澳门之行 7904999
- 2 男子文面6年处处碰壁决定洗文身 7930740
- 3 从今天起你将被饺子支配 7881623
- 4 遥瞰“掌上明珠”澳门 7726875
- 5 吴奇隆好友出面曝光婚变真相 7619223
- 6 冬至是陈奕迅最忙的一天 7581402
- 7 《我是刑警》群演是真警察政委 7480565
- 8 现场:俄多个住宅楼被无人机击中 7374264
- 9 朱婷曾每天吃五粒布洛芬止疼 7289215
- 10 2025年中国经济聚焦“双引擎” 7157399