公司动态

天贝合潜在十倍股分享-空间智能

2025/02

点击蓝字 关注我们

空间智能定义

人工智能系统具备感知、理解和操作三维物理世界的能力,通过数字化构建物理世界的虚拟映射。


具身智能强调智能体如机器人、智能设备需要在身体与环境的交互中实现智能,不断从交互中学习和进化。


类比于人脑,一只猫将玻璃杯推向桌子边缘,人类看见第一反应就能评估玻璃杯的位置,它的几何形状、与猫猫、桌子等东西的关系,然后预测会发生的事件,并采取行动加以阻止。


空间智能是实现AGI的关键一步,它最终目标是实现世界模型,即通过数字化的方式模拟和预测物理世界的运行规律。

通用机器人五个层级能力

L1 无自主操控

   机器人完全由人类控制,不具备任何独立控制甚至决策能力

   类似遥控赛车


L2 基础辅助智能+操控监督

   机器人执行基本的预编程动作并能自主保持稳定,但仍需持续的人工监督

   类似两多足机器人,工业机械臂,扫地机器人等


L3 具身智能+训练监督

   机器人在大量场景中能够经训练后独立运行,但在部分情况下会寻求人工监督

   当前所有人形机器人公司的量产目标是在L3初段


 L4 自成长智能+轻微监督

   机器人能够执行广泛的复杂适应性和协作性任务,并在最少的人工监督下适应


 L5 AGI ASI完全自主

   机器人在认知和物理任务上展现出与人类相当甚至超越人类的能力,在法规和机器人法则下自主运行

空间智能两个层面

物理的三维世界和数字的三维世界,让机器能感知和理解两个世界,并在物理与数字世界之间产生链接。


在数字世界里,空间智能的代表应用是3D生成,以李飞飞首秀、谷歌Genie 2为代表,Sora视频生成模型让计算机生成海量的3D空间场景,生成内容视觉上越来越逼近现实世界,但真正要落地到物理世界,依然会存在不符合物理规律的情况。


很多模型都是根据互联网上的语料信息、图片或视频训练出来的,但这些内容只是物理世界的一种特定记录形式,并不能充分描述物理世界的属性与规律。


在物理世界里,空间智能的应用主要体现在自动驾驶、具身智能领域这与虚拟世界有个根本的区别,他们在感知、理解的基础上,有更为明确明显的行动,可交互这个特点就更加凸显出来了。

空间智能四个要素

算法、算力、数据、具身硬件。


算法百花齐放,算力的发展,按照奥特曼的说法,现在的水平已经足以支撑AGI 的奇点,而具身智能硬件这块,中国也有地利人和、产业链完整的绝对优势。


当前具身智能所面临的难题,如何给机器人提供高质量、可交互的训练数据。


无论是虚拟世界中的3D内容生成,还是物理世界中的具身智能,空间智能的兴起,标志着人工智能从二维感知向三维理解的跨越。

空间智能第一股群核科技

叠被子困境就是一个三四岁小孩都可以干的事情,但对机器人来说是非常困难的,特别是它即使学会了叠一条被子,也很难举一反三。


目前的ChatGPT或者大语言模型,可以很容易地让机器人理解你的指令,或者它的视野里可以看得出哪一床被子叠好,哪一床被子是没叠好,但却没有办法想象出怎么去叠一床被子。


还有一个问题,对于机器人来说,哪怕学会叠了,如果被子换个形状可能就不会叠了。


海量三维数据获取是世界级难题,解决这种问题,最关键的一点是要在物理世界跟数字世界之间建立一个桥梁。


目前机器人的大脑还是数字芯片,它对世界的理解还是个数字世界,但它的身体实在物理世界,需要训练一个大模型来把物理世界能够准确地映射到数字世界里面去,让机器人能够正确地理解物理世界。

高性能计算的两个方向

一个是模拟人类的大脑,也就是GPT们在做的,另一个就是模拟物理世界宇宙万物的运作,这是我们正在做的。


随后发现物理正确的数据不仅能够用来出精美的效果图,还能走到真正物理世界的生产环节里去。通过物理仿真、数字孪生等技术,可精确对接和协同工厂端的生产线,真正实现了个性定制的规模化生产。


见识到了物理正确的三维数据的巨大价值。但是也看见了传统工业机器人的巨大局限性,动作完全是固定的。所谓的无人工厂离真正的没有人,还有很大距离,而且柔性生产线生产的内容也有限,换个材料可能就不行。

群核科技的核心能力

海量物理正确的可交互三维数据和空间认知能力。目前我们拥有3.2亿3D模型,平均每月活跃访问者达7780万,在全球200多个国家地区落地。


提供了一个AI可交互世界。

这两年随着具身智能的爆发时增长,以及空间智能概念的火热,我们跟具身智能、AGIC、XR类的头部公司达成了合作。新机会来了,时代又一次告诉我们该迈向下一步。


目前训练的方式分两种。第一种是真实世界训练,比如standford大学的mobile aloha,通过模仿学习,学习人的行为,使机器人学会根据指令做出相应的行为另一方面,也是一直以来学术界希望做到的另一件事情就是,将机器人从真实环境中的数据采集和训练迁移到仿真环境中,李飞飞的文章也是这个逻辑,因为只有这样的训练方式才能让机器人真正在海量空间里做物理训练,从而有足够多的适应性。


相比真实的训练环境,仿真训练具有无可比拟的巨大优势。包括成本优势、数据生成效率优势。因为物理世界里面,时空是确定的,但是在数字世界里面,事件是可以被压缩的,真实世界跑一万天才能跑完的数据,数字世界里1天就可以跑完。多样性,假设有一天要让机器人去火星上干活,我们没有办法先把一堆设备送到火星上让机器人先训练一遍再干活。可泛化性,也就是举一反三的能力。


这些不是具身智能的全部,这只是开始。未来具身智能将进入家庭、工厂、商业空间、园区和未来更多场景中去。这也意味着在物理正确这个维度,具身智能的训练还有很多待突破的部分。


020-38559796
ten-bagger@qq.com