各大厂争先推出虚拟人的背后原因究竟是什么?
在之前的推文《很快,“不是人”可能不再是贬义词》中我们了解到,除了已经实现应用的直播带货外,虚拟人正在承担越来越重要的岗位,越来越多的企业大胆的尝试投入虚拟人覆盖数据收集、资讯服务、销售后勤等等岗位,甚至作为CEO管理一整个企业的员工;也许不久的未来,有一天我们忽然发现共事已久,甚至相交甚欢却素未谋面的某位同事可能不是个自然人时,也许不会再感到大惊小怪。
这现象的背后除了元宇宙发展大潮的趋势所推动外,还意味着包括图形识别、视觉技术、3D建模、CG渲染、动作捕捉、计算机语音技术、自然语言处理在内的等等技术发展到了一个高层级的表现,同时也是人工智能在完备的硬件基础支撑下,充分的“深度学习”后所展现的学习成果。
虚拟人本质上是对人的一种模拟以弥补人本身的一些不足和劣势,从而将人从原本重复、机械、繁重的工作中释放,而虚拟人对人的模拟,主要源自三个基本特征的“定位”,即外观、行为和思想。
这三个特征的背后是大量技术栈的支撑,涉及众多我们以上提及的领域,马克思曾说过,“人是一切社会关系的总和”,虚拟人的本质是对人的模拟,而对“人”这个概念的解构中,人等于“身体与灵魂”,同时在社会关系中等于“世界与人设”,身体和灵魂(Body&Soul)是组成生命的唯二两个部分。
灵魂主要是指我们身上那些“无形”的部分,例如我们的感知、意识、知识、感情等;而身体主要是指我们自身上“有形”的一部分,包括躯干、四肢、手脚,以及看得见的表情动作等。而当前我们正在进入AI发展的导入期,同时AI正在构成虚拟人的灵魂部分,具体可以分成了几个要素:
①感知
感知是人最生物性的层面,主要和五感有关,即看、听、说三个部分,分别由眼睛、耳朵、嘴来负责,结合到AI上就是CV、ASR、TTS。
②认知
认知是在感知的基础上进一步形成的思考能力,可以分为理性的认知能力和感性的认知能力两个方面。其中,理性的认知还可进一步分为知识储备、理解、决策三个层级的能力,对应于AI中的KG、NLP、ML;感性的认知主要指的是利用AI构建的情感识别功能。
③创造
这一点类似于我们小学的时候会先学习汉字,学习造句,再学习写作文一样,创造是更高一级的智力活动,只有在进行过大量的学习之后,才能进行有效的创造。虚拟人的创造主要依赖于生成类的AI算法来进行输出。
虚拟人的灵魂交给了AI来打造,那身体呢?如果不局限于“有形”部分的具体形态的话,当前的智能汽车、智能无人机、智能移动设备,甚至智能机器人,所有可以承载AI运行的“有形”构建都可以看作是虚拟人的身体部分。
以智能汽车发展的经验来预判,机器人是未来10-15年AI走向加速发展时期的重点对象,为什么这么说呢,刚刚说过如果不局限“有形”部分的具体形态的话,智能设备都是虚拟人的身体部件,而任意部件所积累的感知、规控、操作系统等等技术基础都可以平行移植,延伸覆盖场景,如果把AI的各个要素进行分层,最底层是能源,如果以大量使用为前提,能源的类型又涉及清洁能源领域,这就包括当前在产的光伏、新型电池、储能等领域。
除此之外,还有马斯克手下特斯拉所代表的虚拟电厂,2015年的时候马斯克开启了家用储能产品Powerwall,Powerwall的逻辑就像一块大型电池,能够储存太阳能的能量,实现用户的居家日常供电。以Powerwall为基础,特斯拉与太平洋煤气电力公司PG&E合作,将Powerwall变成一个分布式能源,使用者所用不完的电将反向输送给电网,并且对此行为进行每度电获得2美元的奖励,目前Powerwall已经积累了大量用户,并且就电量而言产生了不小的成果,这是题外话。
AI的各个要素分层的第二层是对算力的需求,特别是端侧算力的需求,背后支撑的核心是芯片;然后是算力的实现,指的是算法和软件,既包括了深度学习神经网络的模型发展,精度越来越高,也包括了从硬件到OS整个软件栈的变化。最后的第四层是数据,是基础设施,包括了采集、处理、训练、应用等一系列活动,这四个要素层衍生出了新型清洁能源、AI芯片、数据传输和存储等多个领域的高速发展。
虚拟人出现的核心逻辑在于“为人类服务”,代替人类完成危险、重复、无聊、又不得不做的任务,或者从另一个角度说是降低人工成本,随着AI应用的不断延伸,优于单一用途的智能汽车、智能手机、智能无人机的智能机器人,可能是实现以上核心逻辑,并支撑AI时代百倍甚至千倍加速增长的最终形态或者最优选项,今年包括但不限于特斯拉、亚马逊、百度、大疆、小米等在内的科技公司,都在推出机器人方案,抢占先机。
Scan QR code with WeChat