前不久,知名社交平台Facebook正式宣布改名为Meta,而这个词取自Metaverse,翻译为中文就是元宇宙、虚拟世界。有了巨头介入,“元宇宙”这个早在1992年的科幻小说《雪崩》中就已经诞生的词语,在2021年又火了起来,成为一个现象级的话题。从定义上看,元宇宙,是整合了数字、互联网等新技术产生的新型虚拟现实应用,并且允许用户对这个虚拟世界进行编辑,提供视听等多方面的沉浸式体验。不只是Facebook,全球的互联网巨头都在追捧元宇宙概念,在这个风口之下,相关话题持续升温。作为元宇宙与现实世界的“沟通者”——虚拟主播似乎已经逐渐融入我们的生活,短视频、电视节目甚至是演唱会上,都活跃着他们的身影。在元宇宙元年,虚拟主播,以及虚拟人机交互技术已经成为首批用户真正能够感受到的落地产品。活跃在各行各业的虚拟主播
虚拟主播并不是什么新的概念,很多年前,初音未来、洛天依等主播就已经在二次元圈子成为“顶流”。而在今年,在元宇宙概念下,虚拟主播/虚拟角色更是如雨后春笋般出现:柳夜熙,一个活跃在短视频平台的虚拟美妆博主,仅靠两部作品,十余天就收获500多万粉丝;在B站,甚至有专门的虚拟主播分区,活跃着嘉然、乃琳、七海、阿梓等大批人气角色,偶像团体A-SOUL的向晚大魔王在生日直播中,2个多小时赚了125万元。虚拟学生华智冰正式亮相并进入清华大学计算机科学与技术系知识工程实验室学习,后续,华智冰还将继续在人工智能领域深造,成为一个知识丰富,并且可以和人类进行良好交互的智能“人类”;上月,央视新闻AI手语主播正式亮相,她可以和人类正常交谈,并且在2022年冬奥会上,她将全程进行手语直播。包括湖南卫视的主持人小漾、济南电视台主持人小沫儿……越来越多的电视台都开始启用虚拟主持人;一直深耕人工智能技术的科大讯飞,早在2018年就与央视合作打造了第一个虚拟主播“康晓辉”。近几年,小晴、小璇、一峰等多名具有独立性格、声线、肢体语言的虚拟主播相继上线,并且可以根据需要切换身份、着装、仪态动作等。与央视新闻联手打造的记者通通、虚拟主播纪小萌,以及和人民日报联合推出的虚拟主播果果,早已在各自的岗位参与了采访、报道等工作。这些虚拟主播不光有人类的声音,还可以模仿真人肢体动作,甚至是眼神等仪态。而其背后的开发团队,在建立角色后还要经过大量的调试,以满足不同场景的需求,让虚拟人能够更接近于真人。比如科大讯飞的虚拟人爱加,她不光可以熟练使用30多种语言和人类进行正常交互,还可以变身新闻主播、智能客服、虚拟医生等多种职业,从穿着打扮、言谈举止等多种维度上都尽可能地接近普通人类,实现无感交互。媲美真人的智能交互
早期的虚拟主播一般都是通过新闻节目主持人的身份和大家见面,甚至一度被怀疑是采集人脸数据之后,再加上人类自己录音,就成了“主播”。随着技术的升级,智能交互技术早已经不是印象中的样子了。现在的AI虚拟主播一般都能够自行学习,并且可以通过语音、文字反馈等方式和用户进行交互。比如在上个月的2021中国网络媒体论坛新技术新应用新业态展示会上,总台记者就在现场和AI手语主播进行了现场交流,沟通完全无障碍,AI主播可以流畅、准确地作出反馈。在今年3月份的两会期间,科大讯飞也联合央视网,让虚拟人爱加陪民众一起关注直播,随时回答用户的提问。值得一提的是,用户可以通过文字、语音等方式进行提问,爱加都能听懂并且正确回答,互动效果和真人几乎无异。而这样的交互,显然和电商平台的“智能客服”有很大区别。智能客服一般是将用户的文字消息和后台数据库中的关键词进行匹配,进行一些简单的订单查询和问题反馈,回答比较固定,而且也没有“人情味”。但是科大讯飞的虚拟人交互平台,在提供海量“问答库”的同时,创新性地加入了语义理解技术,让虚拟人可以结合对话语境,进行自然语言交流——就像和真人对话一样,虚拟人能够真正听懂对话,并且给出精准答案。为此,科大讯飞还利用这套技术,打造了一套AI智能交互一体机,不光有传统触屏的操作体验,她还能和用户进行语言沟通,在商圈、机场、智慧社区、金融机构等场合提供针对性的服务。从“纸片人”到全能主播
其实只要关键词设置得够多,电商平台的“虚拟客服”也能够满足基本的沟通需求。类似的例子还有很多年前的QQ聊天机器人,虽然对话不是那么流畅,但已经能够进行最基本的沟通了。经过多年发展,虚拟人已经具备了学习能力,具备各种相关知识的同时,还能做到得体、大方,使用自然语言和用户沟通,而不是生硬的模板式回答。光是能说会道,显然还不能满足“接近于真人”的需求,因为人类都是有情绪的,而情绪最好的表达就是表情。早期虚拟人的面部表情,一般只有嘴部的张合,再辅以大笑、眨眼等基本动作,和真人的区别还是挺大的。但是近几年虚拟人构建技术越发成熟,不光是制作了漂亮的外观,将表情等因素也都考虑在内,比如登上2021年春晚舞台的虚拟歌姬洛天依、王者荣耀推出的虚拟男团无限王者团、央视AI主播小小撒等形象,加上表情以及一些习惯性动作之后,不再是冷冰冰的“机器”,而更像是一个富有情感的人类。而在背后,工程师需要进行大量的调试。以科大讯飞的虚拟人交互平台为例,从建立人物模型开始,就要经过原画设定、模型建模、骨骼表情绑定等诸多步骤。而一句语音反馈,不只是将文本“翻译”为语音输出,还要通过算法生成人物五官微表情,动态调整虚拟人的嘴型、眼部细节、面部肌肉等。不仅如此,还会通过大量训练,让AI更懂人物的“表情语言”,在说某句话时,根据场景自动预测表情,最终才能呈现出媲美真人的面部特征。作为人类进入元宇宙的“引路者”,虚拟人在今年可以说迎来了突飞猛进的变革。在未来,虚拟和现实的边界将会变得越来越模糊,虚拟人可以出现在手机、电视、VR等任何介质中,甚至包括全息投影。可以预想的是,虚拟人将会更加深入我们的生活,在未来,算力和网络通信速度还会进一步提升,虚拟人将有无限可能。我们会在更多的地方看到虚拟人,而他们,也将我们真正带入元宇宙的世界。关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/