唤活数字人

2024-09-23 121 0

唤活数字人

数字人产业真正的门槛是闭环能力,数字人持续的生命力靠什么来营造?商业模式是什么?


文|钱丽娜

ID | BMR2004


“无论你成为什么样的人,无论你未来将去往何方,我都会爱你,做你永远的朋友……你是我的灵魂伴侣。”


2013年上映的电影《HER》提出了一个在当时令人难解的问题:人会与AI虚拟人产生感情吗?哪怕是一个简单的问题:你是谁?你能成为什么人?在碳基人与硅基人共生的时代,都变得不再简单。


01

数字人“活了”

知名艺术家梅兰芳是如何复现的?


梅兰芳再一次“复活”了。


数字人技术早先由电影行业而来。传统的数字人构建过程是通过艺术家进行数字雕刻,把人物的脸型进行数字化建模,通过骨骼绑定,生成可控制的数据角色,但这一技术的局限在于前期需要高水平的艺术家。


而此次复现梅兰芳时,数字栩生(北京)科技有限公司(以下简称“数字栩生”)收集了梅兰芳的大量照片,邀请中央美术学院教授,以历史照片为依据,制成梅兰芳“实体”肖像。之后,技术团队与雕塑团队完成了以三维数字化为目标的雕像工艺流程,使用高精度激光扫描仪对雕像进行扫描,获取基础静态表情,在动作采集部分,团队邀请梅派弟子演绎,数据录入后,使用角色生成管线,结合梅兰芳的表演材料进行精雕细琢。


人脸有40多块肌肉,能组合成2000多种不同的表情。数字栩生采集人的近60组表情后,将其拆成近500个表情,这些表情运动起来,又能组合出几千种表情,真实地再现了人脸微妙的信息效果。


在攻克3D数字人技术之后,数字栩生新近还开发出了面部4D动态表情光场采集系统。“3D数字人脸采集就是在脸部打点,拍静态照片,用算法去还原运动轨迹,而4D数字人脸采集,相当于坐在设备前做动作,获取的数据是带时间轴的序列帧。”数字栩生首席市场官郭学赟说。3D人脸采集数据可能需要3—4个小时,现在的4D设备只需要40分钟到1个小时。“数字栩生不断推进数字人的研究,从长远看,一是为了创建数字人制作的平台,二是创建数字人功能性的平台。因为未来的元宇宙里一定会有数字分身。”


近来,外网爆火的TEDx演讲者照片超越“恐怖谷效应”,引起了热烈的讨论。在郭学赟看来,这是一个简化版的小模型lora,技术并不新鲜,数字栩生也能够达成相似的效果。数字人的真实度还体现在数字人个性化的语言表达、情感和动作上。


为了让人物动作体现其个性,郭学赟说,数字栩生会在大模型中进行调优,比如加上“怕黑”“爱猫”“神经质”等人物细节,让数字人变得更加真实。


02

为数字人注入灵魂

在ChatGPT出现之前,1.0阶段的虚拟人制作,各家在外形设计上做足了文章。但无论多逼真,都没有灵魂、没有思想。


时间回到2019年,北京齐乐无穷文化科技有限公司(以下称“齐乐无穷”)CEO周道回忆道:“尽管当时市场对虚拟人有需求,但是受技术限制,开发虚拟人的成本非常高,产出极低。定制一个虚拟人至少需要两三个月的时间。”


齐乐无穷团队决定开发一个靠“捏脸”就能生成虚拟人的平台,对标的是美国metahuman平台。当时国内游戏中的虚拟人物都是统一格式,输出52种基础面部表情,但metahuman可以做出几百个骨骼点和表情数。


为此,齐乐无穷推出“虚拟咔咔”,这是全球首款免费创建超写实AI数字人的UGC平台,用户可以在“虚拟咔咔”平台快速生成超写实3D虚拟人,“1500+”调节参数和“40000+”头部面数,保证了虚拟人形象的千人千面。


周道说:“原先的虚拟人无论多逼真,都是没有灵魂、没有思想的。”事实是,在ChatGPT出现之前,1.0阶段的虚拟人制作,各家公司在外形设计上做足了文章。而人工智能出现之后,齐乐无穷将发展方向定为“AI+”虚拟人。“我们看到的趋势是,人与电脑的交互将从文字转向数字智能体,这里将诞生全新的商业机会。”


2000年,一个“互联网+”时代宣布开启。2024年,“AI+”也将重塑各行各业的机会。周道说:“在‘AI+’的趋势之下,‘数字人’将成为链接用户的介质。”


03

数字人的商业机会

人与电脑的交互将从文字转向数字智能体,这里将诞生全新的商业机会。


当一家律所找到齐乐无穷,提出定制一款“法律数字人”时,齐乐无穷对此进行了深入的市场分析。


齐乐无穷提供的是虚拟人开发平台,并不具备法律专长。从当前市场来看,而“互联网+法律”领域没有诞生有市场影响力的商业公司。


齐乐无穷决定另辟蹊径,以“AI+”的方式,选择“直播间的法律咨询”,并以此创建一个“虚拟律师”。


早先,齐乐无穷为数字人取名“包青天”,选择在快手开设直播。按照平台规定,数字人不能独立直播,背后必须有真人律师驱动。在挑选直播律师时,一位年轻的女律师成功入选。“包公”变成了女性?团队灵机一动,索性把“包青天”更名为“包晴天”,外形采用3D卡通形象,这是根据快手平台的人群画像而定制生成的。


在是否由数字人做法律直播这件事上,齐乐无穷团队内部也有分歧。一方认为,法律是专业而严肃的事,人们只会咨询真人律师;另一方认为,人们在做法律咨询时,相对隐私,虚拟人反而让人更有安全感,更愿意交流。


2023年10月,“包晴天”直播间开播,在线普法。在没有投流的情况下,直播间当天迎来了200多位观众。到2024年8月,“包晴天”仅在快手上的粉丝就逼近250万。周道说:“事实证明,选择数字人直播是对的,年轻人更喜欢跟虚拟人聊天,遇到校园霸凌、早恋等问题时,他们不敢与家长或老师说,就会来直播间寻求帮助,人们更愿意向数字人敞开心扉。”


“包晴天”的专业性其实是来自与齐乐无穷达成战略合作的一家全球著名律所。合作方积累了30年的法律数据,经过专业人员的数据调优和‘清洗’,从而形成了强大的法律语料库。“包晴天”所提供的内容和意见由专业法律团队审核和把关,除了直播连线,“包晴天”在短视频方面也会结合时事热点为大家带来解读。


“中国只有70多万名律师,要服务14亿人,每个人遇到的法律问题不同。数字人直播降低了普法的门槛。”周道说。


周道认为,数字人产业真正的门槛是闭环能力,数字人的持续生命力靠什么来营造?商业模式是什么?最终比拼的还是商业模式。要没有回血能力,虚拟人开发是很难持续下去的。


对比中美两国数字人在技术赛道和应用领域上的特点,郭学赟认为,美国方面可能更强调底层算法,强调艺术性的表达,注重电影特效,它们在这方面的探索更多一些。相对来说,中国的数字人,且大多是2D数字人在电商平台做直播赚钱。郭学赟说,“中国的特点是找到一个商业化的角度,先把技术用起来。”


04

数字人的法律问题

如果将人数字化,就应该获得人身权对应的全部授权。


在奇幻动作影片《传说》中,博纳影业推出了成龙年轻时的形象。未来,预计还会有越来越多的数字明星进入市场,而这其中涉及到的版权保护也是全新的课题。


上海大邦律师事务所高级合伙人、知识产权律师游云庭认为,数字人的数字资产包含知识产权和数据两部分。知识产权是数字人自身构成的相关知识产权,比如美术形象、人物设定。数据则是指用户和数字人交互所产生的相关数据,这些都有一定的商业价值。


虚拟数字人形象属于美术作品,但它和用户互动背后所依赖的数据库属于数据集,美术作品则归设计者所有。如果数字人是由人工智能创作的,根据目前的著作权法,该作品不受保护。


博纳影业在《传说》中复刻的是成龙27岁时的形象,游云庭认为,经过授权的形象训练出的成年或老年时成龙的数字形象,如果没有协议特别约束,应该不需要另外的授权。授权之后的相应形象是不是可以使用在其他的电影或媒体创作中,也要看双方原始合同的授权范围。


版权方获得了成龙年轻时的数字形象,若新形象与最早的数字形象有极大程度上的相似,是否涉及版权侵权,要看其他使用方获取原始形象后的训练是否经过授权,同时训练输出的内容也获得过成龙的授权,那就不涉及版权侵权。


数字人的著作权应该由合同来进行界定,如果合同没有约定,原始数字人特征文件还是受保护的,加工使用这些特征文件,仍然需要原始的技术公司授权,否则新的创作如果发表,就侵犯了原始数字人的版权。


实际上,个人除了版权之外,他还会有肖像权、声音权、姓名权等权利。如果将人数字化,就应该获得人身权对应的全部授权。


游云庭说,在“包晴天”的案例中,如果数字人作为法律普及者,在知识传播中出现失误时,首先看它的用户协议以及用户的使用提示中有没有对用户进行过提示。如果进行过提示,那用户就有义务去复核相应的结果,此时出现失误,数字人的所有方,也就是运营者应该不承担责任。如果没有进行过提示,运营方可能还是会有一定的过错责任。


来源 | 《商学院》杂志9月刊



我也说一句

已经有条评论

全部评论

    上一篇:亚马逊建“数据湖”,让数据治理水到渠成

    下一篇:讯飞&商汤:用AI挖掘医疗数据“矿藏”

    QQ空间 新浪微博 豆瓣网 微信

    请先来登录吧

    没有经营者账号?立即注册
    忘记密码?

    请先来注册吧

    已有经营者账号?立即登录

      报名成功!

      请保持手机正常使用,我们会随时与你联系确认

      知道了

      加入班级成功!

      请保持手机正常使用,我们会随时与你联系确认

      知道了