为什么科技大厂纷纷放弃了元宇宙,而拥抱了AI?
最近几个月,ChatGPT的热度一直保持在高位,已经超过了过去几年提出的元宇宙概念。上一次元宇宙大火是在2021年,当时号称元宇宙的第一股Roblox上市,当时在营收不到10亿美元的情况下,几个月后市值最高突破了700亿美元。Roblox上市后,它带动了Metaverse元宇宙这个词语在互联网圈里的疯狂传播。2021年10月,拥有30亿用户的Facebook正式改名为Meta,并宣布转型为元宇宙。他们打算打造一个全新的虚拟社交环境,押注这将成为移动互联网的后继发展趋势。Facebook的大动作激发了投资市场的更多元宇宙热度。
元宇宙中最主流的几个方向包括VR(虚拟现实)、AR(增强现实)、MR(混合现实)和云游戏。很多互联网巨头都在这些领域投入了大量的资源。例如,Facebook在2014年就花费了20亿美元收购了Oculus VR;微软在2015年发布了早期开发的HoloLens项目;谷歌在2012年发布了Google Glass,并在2019年通过发布Stadia平台正式进军云游戏。
我也刚好在过去的几年里体验了一些非常有创意的元宇宙相关产品。当初使用时,感觉这是未来世界之门已经打开了。但是,长期使用过程中,我还是能感受到体验的不完美,很多产品最终还是被束之高阁。那么,是什么原因导致元宇宙的发展不及大家的预期呢?
Facebook的元宇宙之梦
2014年3月,Facebook以20亿美元收购了Oculus VR。自收购以来,Facebook一直投入大量资源和精力促进Oculus的发展和推广。其中最显著的动作是推出了Oculus Rift和Oculus Quest等虚拟现实头戴设备,并不断升级和改进这些产品的性能和功能。同时,Facebook还投入了大量的研发和人力资源,致力于开发更多的VR和AR应用程序和内容,如Facebook Horizon和Oculus Venues等虚拟社交网络和体育、音乐等虚拟活动平台。
在2016年,市场上的VR产品还分为连接PC的VR平台的VR设备和完全独立的VR一体机。通过有线或无线连接PC的显卡,可以使VR头戴设备专注于显示和操作效果,但这种方式也使VR设备失去了便利性。在市场发展过程中,更便利的VR一体机逐渐占据市场,创造出直接基于智能手机平台芯片改造的VR一体机。但由于性能较差,这样的VR一体机在那些非常吸引人的VR大型游戏中表现不及预期,由于刷新率低、掉帧等问题,有时会使部分玩家出现头晕目眩的感觉。就性能而言,最新的VR一体机的表现可能还不如几年前的PC平台显卡给力,这也无法让第一代玩家有飞跃的体验。另外,VR设备最大的难题是,用户很难得到物理规律的体验,例如加速、减速、失重等,这使用户很难适应虚拟出来的场景,普通的VR一体机往往最终沦为视频观看的工具。
即使是看视频,VR视频的制作成本要远高于普通普通手机的短视频制作。在过去几年中,Facebook的最大竞争对手已经变成了TikTok。在2020年,TikTok的月均用户使用时长首次超过了Facebook。由于智能手机已经普及,各种短视频应用程序也给人们带来了很多真实的体验。例如,人们可以观看到来自世界各地的人们拍摄的当地特色文化活动和美食,以及不同行业的人分享一些外行很难见到的场景。短视频使每个人都成为了新闻采集者、内容制作者和生活中的导演。此外,TikTok生态中的各种工具体系可以帮助人们降低视频制作成本并附加各种特效,从而使内容传播更高效。由于短视频内容的真实性和精准的推送规则,短视频广告变现能力也比普通社交媒体更强。因此,Facebook的战略受到了真正的挑战。
虽然售价仅为299美元的Oculus Quest2销量已经超过了1000万台,占据了VR产品行业大部分销量,但与全球超过40亿的智能手机存量相比,这显然是一个非常小的产品市场。此外,无论是使用时间、使用频率还是内容制作成本和丰富度,VR设备都无法与看起来技术门槛不高的手机短视频相比。
谷歌眼镜与谷歌的云游戏
谷歌曾经发布过许多引人瞩目的产品,但大多因为概念过于超前或者运营不佳而未能持续发展,谷歌眼镜和Stadia云游戏就是其中的典型代表。
2009年,谷歌启动了Project Glass项目,旨在研发一款可穿戴智能设备,以提升用户的日常体验。2013年,谷歌发布了面向开发者的Glass Explorer Edition,售价为1,500美元。该设备可通过语音命令控制,用户可使用其拍照、录制视频、发送信息等。2014年,谷歌开始将谷歌眼镜推向商业市场,并与眼镜品牌Ray-Ban和Oakley合作,将谷歌眼镜技术整合到这些品牌的眼镜中,以提高产品的外观和实用性。
谷歌眼镜在最初发布时受到科技发烧友和开发者社区的高度评价,但该设备的摄像头和语音记录功能引起了许多人的隐私担忧。在某些场合,如电影院、商店等,佩戴谷歌眼镜还可能被视为违法或不适当的行为。此外,谷歌在硬件领域上并没有大规模投资的决心,因此需要解决如何通过生态伙伴来增强谷歌眼镜的应用丰富度、提高续航能力以及降低生产成本等问题,才能吸引普通消费者购买。
谷歌曾在2018年的内部项目中,通过Chrome浏览器远程运行大型游戏《刺客信条:奥德赛》,旨在降低大型游戏的门槛。2019年GDC大会上,谷歌CEO Sundar Pichai宣布了面向所有人的游戏平台Stadia。索尼的PS平台和微软的Xbox游戏主机,这些平台都需要独立的硬件和软件;普通电脑上要想流畅运行大型游戏,需要配置优秀的显卡。然而,高端显卡的功耗使得在笔记本电脑上的性能受限,这无疑提高了游戏门槛。许多同学在读书期间花费大量时间玩制作精良的大型游戏,但工作后由于时间和环境的限制,不得不舍弃这些游戏转而玩入门更便捷的手游。
谷歌Stadia的设想非常吸引人:任何配置的笔记本电脑和Pad只要能运行Chrome浏览器、能够接入高速互联网,就可以享受主机级别的游戏体验。无论对硬件要求多高的游戏,都可以在云端运行并与用户进行交互。这将大型游戏变得像普通网页游戏一样简单。
然而,谷歌也低估了游戏领域的“共享难度”。大型游戏对显卡资源消耗极高,即便是独立显卡也无法满足极端画质的需求。由于功耗、散热和通信带宽的限制,单台服务器能够安装的显卡数量也有限。显卡很难像CPU和内存那样低成本地虚拟化,虚拟化的生态也还不够成熟。
大型游戏要么是在专有平台上开发,要么是在 Windows 平台上开发。想要将这么多游戏迁移到低成本的 Linux 服务器平台需要大量工作量。谷歌的开发团队也低估了这个项目所需的资源和时间周期。
在云游戏中网络带宽和延迟是个终极难题。在 2016 年之前,蓝牙耳机一直是个小众市场,直到苹果 AirPods 的蓝牙耳机发布后有了数百倍的增长。AirPods 在合适的体积内将通话延迟稳定地控制在 100 毫秒以内。在这个范围内,普通用户很难感知蓝牙耳机与有线耳机的差异性。
要想体验好的云游戏,需要将终端和云端的双向交互延迟降低到人类感知的极限,即 100 毫秒以内。这就要求单向延迟控制在 50 毫秒以内。在公共网络环境下,公网延迟加上无线延迟往往就有数十毫秒了,留给终端的处理时间所剩无几。要知道,中美之间的光纤距离超过一万公里,即使在没有中继器的情况下,单向通信光速的传播也需要 33 毫秒。我们经常刷一个普通网页都需要半秒的反应时间,何况是 4K 的云游戏流媒体内容压缩和渲染。在我们使用过的开源云游戏平台测试中,在内部网络环境中,普通终端和游戏服务器大约能做到 40-60 毫秒的延迟。而在公共网络和无线网络的情况下,延迟基本上都会超过 100 毫秒。云游戏的最佳场景可能是网吧或者电竞主题酒店,可以通过局域网达到较好的游戏体验。
大型游戏往往剧情复杂,对玩家的要求也高。无师自通的打通整个游戏往往需要几百个小时的时间,现代社会的年轻人很难有大段的完整时间来体验整个游戏。对于时间有限的玩家来说,他们更倾向于在各种游戏解读视频和直播平台上满足自己的需求,成为更自由的观众。视频直播平台在一定程度上成了云游戏平台的竞品。
在2022 年 9 月,谷歌宣布将于 2023 年 1 月关闭 Stadia 服务器,并将费用退还给用户。相比之下,2021年非常火爆的云游戏平台Roblox虽然比Stadia简陋,更像是一个简单的网络共享游戏,但是它提供了类似于低代码平台一样门槛更低的Roblox Studio创造平台,吸引了大量有创造力的年轻玩家来创造各种独特的游戏场景,并通过自发的宣传来吸引其他玩家,从而获得了大量的用户流量。
微软的HoloLens
2015年1月微软在举行了Windows 10发布会,最后出场的HoloLens混合现实眼镜将这场发布会推向了高潮。
2014年9月,微软宣布以25亿美元收购瑞典沙盒游戏Minecraft(中文名“我的世界”)的开发商Mojang。这款类乐高积木的游戏可以为HoloLens应用提供更多元素。虽然Minecraft在全平台的销量超过了2.38亿份,但用售价超过3000美元的HoloLens来体验这款游戏的成本显然过高。
微软从谷歌眼镜在2C领域所遭遇的隐私问题中吸取了教训。由于成本和定价过高,HoloLens后来的发展方向转向了2B的工业元宇宙领域。HoloLens在建筑、汽车、制造设计、医疗、教育、军工等各个领域都能发挥作用。
借助HoloLens,制造业可以构建更加敏捷的工厂,并提前训练员工在虚拟的工厂中进行复杂生产流程的协同预演。在工业设计方面,HoloLens使得设计人员可以更真实地感受自己的设计作品,从而进行更敏捷的迭代。医疗保健专业人员可以与远程专家保持联系,调用护理点的患者数据,并超越X光片,查看三维MRI图像。
HoloLens提供了完善的API接口,方便用户将HoloLens与其他企业级软件进行连接。但是2B的发展往往是以项目和解决方案的方式推进,节奏也会比2C的要慢得多。因此,HoloLens的销量要远小于面向2C的Oculus Quest产品。
另外,HoloLens主打的混合现实对计算能力的要求更高,混合现实需要捕捉现实场景并进行实时运算。HoloLens基于高通骁龙850计算平台,但其性能比最新的高通手机芯片骁龙8 Gen2要落后好几代。由于新能源汽车的发展迅猛,高通需要将更多的研发资源转移到车载芯片领域,难以在元宇宙配套芯片上投入持续的研发资源。因此,VR、AR和MR产品的SoC平台往往落后于主流手机芯片SoC两三年的水平。如果用户在最新的手机芯片平台上都感受不到惊人的性能和应用体验,那么在续航、功耗和性能都要更弱的元宇宙产品里就更难有好的体验了。
元宇宙目前的瓶颈
目前,元宇宙的发展面临着许多瓶颈。通过使用市场上与元宇宙相关的产品,我们可以发现该领域存在着许多问题:
物理终极难题:带宽延迟、光速以及人类感知的100毫秒门槛等极限限制了元宇宙的发展。
虚拟世界中无法体验的加速度也是物理终极难题之一。
内容生态:为了形成一个有流量的生态体系,炫酷的产品不仅需要降低门槛来迎合使用者,还需要讨好内容创造者。
硬件生态:如果产品无法扩大规模,芯片厂商就难以重视,导致元宇宙产品的芯片性能往往落后于主流手机1-2年。
性能:元宇宙的体验需要达到传统PC和最新手机平台的水平,包括支撑4K分辨率和60HZ以上的刷新率等。
便携性:传统的VR/MR一体机重量超过500g,续航时间不超过三小时,影响了用户的体验。因此,未来的元宇宙设备需要轻便易携,不给用户额外的负担。
竞争产品:元宇宙产品的使用时长、频率和用户范围,与手机、直播等产品的竞争关系。
隐私:一些面向2C的元宇宙产品由于隐私问题难以推向市场。
大厂纷纷放弃了元宇宙,而拥抱了AI
跟元宇宙碰到的各种物理终极问题相比,规模越来越大的AI模型和海量数据使得AI的突破变得可能,大规模AI集群的训练也会比解决光速问题更现实一些。
OpenAI在2022年11月份发布了ChatGPT,吸引了无数科技爱好者的探索欲望。虽然ChatGPT回答人们问题的答案不一定非常精准,但是ChatGPT对人类提问的解读相当到位,这是人类第一次在人机对话上感受到了质的变化。ChatGPT的成功给科技行业指明了一条道路,证明大模型是可以攻克人类语言理解的难题。有了ChatGPT这个突破,各个科技大厂纷纷在AI方向投入巨量的资源,希望在短期内能有所突破,以免被时代的车轮甩在后头。
微软这边,HoloLens负责人Alex Kipman于2022年6月离职。据彭博社报道,微软在最近的裁员计划中,也包括混合现实硬件(MR)HoloLens和Xbox等部门。2023年1月,微软宣布旗下VR社交平台《AltSpaceVR》将于3月10日正式关闭。
在ChatGPT发布之后,当被问及“当下有什么重大的技术转变与2000年的互联网类似”时,比尔·盖茨表示:“元宇宙本身没有革命性,但人工智能很有颠覆性”。微软一边在VR和XR业务上减员,一边在AI方向大力投入,给刚发布的ChatGPT走红的OpenAI又追加了100亿美元的投资。
自2023年起,谷歌已放弃其云游戏平台Stadia,该计划未能让谷歌在云计算时代的游戏领域实现弯道超车。历史证明,微软、索尼和任天堂等游戏公司都无法仅仅做硬件和软件平台而放弃内容制作,因为游戏产业是一个以内容为主导的行业。新平台最能吸引用户的是第一批游戏,而这需要厂商自身的游戏工作室投入大量资源。在看到平台成熟之前,第三方工作室很难决策去做资源的投资。
谷歌的核心盈利产品是搜索领域,因此能够理解人类语言的ChatGPT模型将会对搜索带来革命性的变革。在传统的搜索领域,搜索引擎的变现靠广告和流量,因此在搜索自己想要的“真理”时,用户也会看到很多类似噪音的广告。如果搜索引擎加大广告的商业转化,用户的搜索体验就会变得很糟糕,而在互联网上找到最本质的东西就会更难。智能搜索引擎的目标是提供最终答案,可以通过订阅式的商业模式来运行,从而避免无效广告这样的附庸,收入和产品完全匹配。
在OpenAI的ChatGPT的冲击下,谷歌也开始快速调整自己的节奏。2023年2月,谷歌紧急发布了一个对标ChatGPT的AI系统-Bard。但是,产品演示视频中犯了一个事实性错误,导致美股开盘后谷歌股价大跌7.68%,市值一夜蒸发约1056亿美元。谷歌内部将ChatGPT视为“Red Alert红色警戒”级别威胁,并请回谷歌公司联合创始人谢尔盖·布林和拉里·佩奇,开始头脑风暴商量对策。如果谷歌无法实现对OpenAI的追赶,其核心的搜索引擎业务将会受到严重的挑战。
Facebook、Twitter等社交网络中有丰富的人类对话数据源,这些数据可以为AI大模型提供训练的基础。在ChatGPT出现之后,Facebook也迅速开源了一个新的大模型系列——LLaMA(Large Language Model Meta AI),参数量从 70 亿到 650 亿不等,可以在配置更低的AI集群中训练和运行。
从2019年到2021年,Facebook旗下的元宇宙业务(Reality Labs)的运营亏损分别为45.03亿美元、66.23亿美元和101.93亿美元,短期内看不到盈利的可能。Facebook的战略是否是一个大跃进,从图文平台,跨过短视频,一下子跳跃到元宇宙VR的虚拟世界?通过发力AI,也许可以帮助Facebook实现最终的元宇宙梦想。
元宇宙与AI的关系
从谷歌、Facebook和微软目前的几款元宇宙相关产品来看,除了硬件和物理定律的限制以外,产品普及的另一个难题是内容和生态的门槛。相比手机短视频,元宇宙里的内容数量很少,很多用户几天后就再也找不到新鲜感。
随着强人工智能的出现,AI 生成的内容 (AIGC) 可以帮助甚至取代人类进行内容创作,成为强大的生产力工具。例如,ChatGPT 可以按照人类的提示创作小说,开源的 AI 绘画项目 Stable-Diffusion 绘制的画面几乎可以以假乱真,面向消费者的 DreamStudio 已获得超过100万用户,生成了超过1亿张图片。
可以预期,在 ChatGPT、DreamStudio 等应用中,未来会产生越来越多的内容,刚开始可能仅限于文字和图片。但随着 AI 算力的加强和模型的迭代,AI 可能会低成本地生成短视频、VR 等内容,并且不用考虑版权限制。在内容供应不限量的时代,元宇宙产品创新的团队可以专注于产品本身的功能和性能的突破,不会因为内容不够而早期夭折。
当元宇宙场景更加丰富时,系统可以捕捉人类在元宇宙中最真实的动作、反馈和想法,为 AI 提供最佳的训练数据,从而可以训练出与真人反馈一致的 AI 模型,从而进一步促进个性化 AI 的发展。有关更具体的内容可以见下面这两篇文章:
《元宇宙是开放的数字世界》 《为什么元宇宙还没落地?》
至于元宇宙的终极难题,在虚拟环境中无法模拟物理世界的加速度和其他复杂体验,也许未来双向的脑机接口技术可以解决这个问题。通过脑机接口技术,可以让人类的大脑成为元宇宙的仿真底座,而不是基于现在的 VR 一体机。人类的大脑可以在睡梦中轻松模拟各种场景,通过人类的记忆、推理能力和脑机接口的适当刺激引导,也许可以实现100%真实的元宇宙场景,说不定还可以跟其他人的梦境互联互通。也许,电影《盗梦空间》中描绘的场景就是未来最真实的元宇宙。
微信扫描关注公众号,及时掌握新动向
2.本文版权归属原作所有,仅代表作者本人观点,不代表比特范的观点或立场
2.本文版权归属原作所有,仅代表作者本人观点,不代表比特范的观点或立场