祝铭明:元宇宙的本质、底层和核心技术

启元社 阅读 3338 2022-5-7 21:52
分享至
微信扫一扫,打开网页后点击屏幕右上角分享按钮

祝铭明:元宇宙的本质、底层和核心技术

Rokid从成立第一天起,我们对自己就有一个明确的定位:

我们更关注的是如何将真实世界与虚拟世界融合。

由此,我们把开发的重点放在了AI和AR上,在VR方面不做过多探索。今天,大家谈元宇宙都很喜欢畅想未来,但是Rokid想关注一些更本质、更底层的东西。

对此,我总结了5个方面。

第一,是感知能力。这会偏向于麦克风、照相机等传感器方面的技术。

第二,是理解能力。AI的范畴非常广,Rokid更关注AI在感知的基础上如何理解这个世界,通过周边的环境理解人与事。

第三,是协同能力。实现人机交互,首先要对人与人之间、人与事物之间的协同深度思考。

比如Facebook推出的VR远程办公应用、我们这次线上直播会议,也都是某种协同。

Rokid也在这个领域里面,有一些自己的思考。我们认为协同不仅是在虚拟世界中进行,更是真实世界与数字世界的融合。

第四,是展现能力。

现在大家谈论AR、VR、MR,更多关注的还是容易吸引眼球的东西。

这就体现了展现能力,其背后是基于光学、图形引擎、空间引擎和算法等方面技术。

最后还有一个方面不得不重视,是数字资产。

这其中包括创作工具、生产工具、管理及安全等方面的能力。

以上这个5个方面,Rokid会有自己的思考,但也不会自己单打独斗做所有的内容。

我们会和整个产业界合作,最终将这5个能力融合到自己的操作系统中,为大家提供对应的硬件产品和开放平台。

为什么Rokid更关注底层能力架构?

因为探索Metaverse是一条非常漫长的路,会延续5年、10年、20年甚至更久。作为一个实业类的公司,我们和其他研究型团队或者机构不大一样,我们会更加关注一些核心能力和整个路线该怎么走。

Rokid想做的是一步一步带大家到那个地方去。

四个象限划分AR眼镜

而从一家产品平台型公司的角度出发,我们还会考虑技术的载体。

除了前面提到的5个能力,针对终端设备,我们也有4方面的思考。

横轴从使用场景出发,纵轴从功能属性出发,我们将AR眼镜大致分为四个象限。

首先看第四象限,偏工具属性、强调日常长时间佩戴。

其中这款产品叫做Rokid Glass,现在已经升级到了第二代Rokid Glass 2.

2019年我们就发布了这个产品,已经在全球范围内有了应用和落地。

就在今早我们刚刚得知消息,代表全球最精密生产线的瑞士手表,也将我们列为了它的生产合作伙伴,并且在主页上有长篇介绍。

再看第三象限,这部分希望AR眼镜可以用在专业领域、更强调计算能力。

其中这款产品叫做X-Craft,它强调展现计算能力,带有GPS、GPU、NPU等大量计算单元。

它也是一款在全球范围内销售的产品,国内许多能源制造企业中都已经有了应用。

而在第二象限,我们也在考虑如何让AR眼镜逼近每一个人的日常生活,

所以今年我们上线了一款名为Rokid Air的产品。

它虽然还不能做到像普通眼镜那般容易佩戴,但也已非常轻便,放在口袋里毫无压力的那种。

祝铭明:元宇宙的本质、底层和核心技术

同时它的能力也更偏向内容交互。

今天我们谈论Metaverse,很多人可能是受到这一象限产品的影响。

目前在一些众筹网站上已经有人抢先体验到了这款产品,反响很不错;所以我们最近也在筹备大规模销售,今年年底它或许就会和大家见面。

祝铭明:元宇宙的本质、底层和核心技术

当然我们也不会放弃继续探索可每天日常佩戴的场景。

在第一象限内,我们一直保持的产品研究方向叫Rokid Vision,目标是希望它能像普通佩戴眼镜一样方便,而不仅仅只是用在一些特定场合。

以上就是我们对整个AR产品的布局、衡量和定位。

覆盖智能制造、文旅、娱乐等领域

其实德国很多汽车厂都在使用Rokid Glass系列产品,如奥迪、宝马、奔驰、保时捷等等。

尤其在疫情期间,Rokid的产品非常受欢迎,直到今天仍然畅销。

与此同时,我们还将AR眼镜和疫情防控结合在一起,其优势更多体现在人性关怀。

当测温人员佩戴AR眼镜后,在几米远的位置就能识别到每个人的体温,由此便无需将人拦下来,通过测温门或者体温枪指着人的方式来测温。

这其中用到了大量的AI技术,可以保障很高的精确度、稳定度,还能同时识别多人体温。

这个产品目前在全球有70多个国家和地区使用。

智能制造业方面,美的、比亚迪等国内灯塔工厂都在使用我们的产品。

如下展示的,就是在生产线上使用Rokid Glass2的场景。其核心在于如何让使用者不用编写代码、就能完成对自己整个工作流程的设定。

我们将AI能力与无代码、低代码配置平台结合,让更多人能够快速将我们的产品用在不同生成领域,这也是行业里比较领先的做法。

事实上,当我们谈论AR或Metaverse时,硬件只是其中之一,更重要的是后台算力等方面的能力。

在此,我给大家举一个例子。

在中石油AR智能辅助系统中,X-Craft更强调安全性,它配有北斗和GPS,同时也防尘防爆防污染,是一个专门针对重工业领域的产品。

而这个系统与国家电网的AR巡检/运维系统,在产品形态上有所不同,但基本平台是互通的。

这其实就是Rokid根据场景对产品的定制和细分。

但在此也分享一个我们的观点:Rokid不认为现在可以用一个通用产品来覆盖所有场景。

如果想要在行业里落地,我们都是会针对每一行业的特性对产品进行打磨。

而除了工业上的应用,我们还希望Rokid能够走到消费类市场。

比如Rokid Air,它最早被使用在文旅场景里。国内很多景点都在用Rokid Air进行文物或景区解说、导览、甚至一些古建筑重现。

大家知道现存的很多古建筑遗址,无法重现往日的辉煌,但是我们通过AR技术可以将它们重现。

目前我们也在如火如荼地推进这块业务,已经成立了团队专门建设生态体系,同时我们还引进很多伙伴帮忙进行内容创作、线下服务和推广。

我相信AR技术在文博领域会对传统导游解说、机器解说、二维码讲解带来一次全新的变革。

这里要强调一个概念,Rokid做人机交互是由不同阶段的。

从最早的指令型人机交互,再到图形化人机交互,显然是对人越来越友好的。

我们认为下一代人机交互会和AI息息相关,我们将它定位为基于专注力和意图的人机交互。

在文博领域,我们就是在打造这样的能力。

举例来说,如果使用Rokid的AR眼镜,在逛博物馆时无需做任何指令,不需要任何点击、操作,只要盯着界面就可以操控。

这样的AR眼镜自身可以去理解周围环境,能掌握使用者的注意力在哪里,最后还能推荐信息。

整体的操作会非常简单,不管是老人孩子,甚至是不会使用手机的人,戴上这样的AR眼镜走进博物馆,都能有非常好的体验。

再给大家分享一个产品,就是我们对消费级AR眼镜的尝试——Rokid Air。

它更侧重于让每一个人都能体验到AR。

在此当然娱乐先行,比如更加高清的视频体验、娱乐游戏互动,它不仅仅是更大屏幕,而是从交互上给大家展现更多不一样的内容。

祝铭明:元宇宙的本质、底层和核心技术

Rokid认为,如果元宇宙是一个发展方向,那元宇宙不应该局限于虚拟世界、不应该与真实世界割裂,它应该是考虑如何将人与真实世界、虚拟世界进行融合。

所以我们会不遗余力地在AR领域探索,让我们的产品成为大家进入元宇宙的一个入口或桥梁。

开放Rokid的系统给大家用

最后再和大家介绍一下Rokid的系统。

我自己、我们团队中,很多人都有做AR研发的背景,在这个领域里大家可以看到,Rokid一直致力于建立自己的系统。

很多人或许会问,在Metaverse中系统和过去的OS、基础平台会有怎样的区别?

在此我和大家分享一些Rokid的思考:

我们认为有3个核心区别。

第一,当然是从2D到3D的变化。而且这个3D还不是传统意义上的3D屏幕,而是一个空间的概念。

第二,是在界面、输入方面的变化。原来我们通过键盘、鼠标来操作系统,未来则可能通过你的眼睛、语言、意图、姿态、大脑或者更多方式,这个将会非常有趣。

简单讲,就是从指令式交互变成注意力或意图交互。

第三,是将真实世界和虚拟世界融合的变化。这是大势所趋,也是Rokid在构建自己的系统时,一个非常重要的理念。

大家可以看到,我们将传统的OS系统作为底层,向上来构建能力。

这样一来,开发者就不用关心AI、不用关心AR,也不用关心数字引擎、空间引擎等,只需要去做内容开发和相关应用就好,

这一系统我们也会对外开放,目前已经有超过200个专业开发者在使用Rokid的OS。

如果大家之后拥有了我们的产品,就能在上面看到非常多精彩的游戏和应用。

但是Rokid本身并不认为,Metaverse很快会发展到每个人都能用的阶段,不会有那么快。

不过Rokid还是会耐着心一步一步打造我们的基本能力、平台、产品,帮助大家一步一步走到未来的那个世界。

最后,和大家分享一下Rokid的口号:Leave Noboby Behind。

我们希望将来科技和人文可以融合,让越来越多人都能够使用我们的产品、让科技为他们服务,真正做到每个人、每天都会使用未来新技术。

btcfans公众号

微信扫描关注公众号,及时掌握新动向

来源链接
免责声明:
2.本文版权归属原作所有,仅代表作者本人观点,不代表比特范的观点或立场
2.本文版权归属原作所有,仅代表作者本人观点,不代表比特范的观点或立场
上一篇:NFT集体“降温”,大厂们转押数字时尚 下一篇:元宇宙NFT的大规模采用将为下一个NFT增长周期提供动力

相关资讯