群核科技官宣开源空间理解多模态模型 可用于具身智能训练等领域
创始人
2025-03-19 16:42:57
0

3月19日,记者从群核科技获悉,在GTC2025全球大会上,群核科技宣布开源空间理解模型SpatialLM。据介绍,这是一个基于大语言模型的3D场景语义生成框架,突破了传统大语言模型对物理世界几何与空间关系的理解局限,赋予机器类似人类的空间认知和解析能力。群核科技称,这相当于为具身智能领域提供了一个基础的空间理解训练框架,企业可以针对特定场景对SpatialLM模型微调,降低具身智能训练门槛。

上证报中国证券网讯(记者 谭镕)3月19日,记者从群核科技获悉,在GTC2025全球大会上,群核科技宣布开源空间理解模型SpatialLM。据介绍,这是一个基于大语言模型的3D场景语义生成框架,突破了传统大语言模型对物理世界几何与空间关系的理解局限,赋予机器类似人类的空间认知和解析能力。群核科技称,这相当于为具身智能领域提供了一个基础的空间理解训练框架,企业可以针对特定场景对SpatialLM模型微调,降低具身智能训练门槛。

群核科技相关技术负责人介绍,此次开源仅是开始,接下来SpatialLM模型将继续迭代如自然语言和场景交互等功能。

据悉,该模型仅通过一段视频即可生成物理正确的3D场景布局。基于从视频中提取的点云数据,SpatialLM模型能够准确认知和理解其中的结构化场景信息。目前,SpatialLM已在HuggingFace、GitHub、魔搭社区等平台面向全球开发者开源。

“我们希望打造一个从空间认知理解到空间行动交互闭环的具身智能训练平台。本次开源的SpatialLM空间理解模型旨在帮助具身智能机器人完成在空间认知理解上的基础训练。而去年群核科技发布的空间智能解决方案SpatialVerse,则希望进一步通过合成数据方案为机器人搭建最接近物理真实的‘数字道场’,实现机器人在仿真环境中的行动交互训练。”群核科技董事长黄晓煌介绍。

据了解,群核空间智能平台SpatialVerse也亮相GTC,它与SpatialLM模型之间“协同合作”,打通了“现实-虚拟-现实”的闭环路径,共同为具身智能架起一座数字仿真与物理现实之间的桥梁。例如,SpatialLM模型通过从视频到结构化场景的转化,将现实世界的数据转化为虚拟环境中的丰富场景,而基于SpatialVerse的合成数据引擎,一个结构化场景又可泛化生成亿万级新场景。这也意味着,现实世界将成为SpatialVerse“数字道场”的原料来源。

“我相信全球很快会迎来具身智能机器人的爆发性发展,在具身智能背后,是算力、算法、工程和训练数据四个板块的协同进化,这需要全行业合力推动。群核科技希望通过空间模型和数据开源一起推动技术基座建设,为这个技术奇点的来临贡献一份力量。”黄晓煌介绍。据悉,在空间和具身智能训练上,目前群核科技已与硅谷头部科技企业等在内的一批国内外具身智能企业达成合作。

相关内容

热门资讯

台风“丹娜丝”致四条“小三通”... 来源:中国新闻网 中新社福州7月5日电 (记者 闫旭)随着今年第4号台风“丹娜丝”逐渐逼近,福建省防...
江苏重大项目建设不惧“烤”验,... 连日来,我省持续被高温晴热天气笼罩。然而,酷暑并未阻挡重大项目建设的步伐。在全省各地重点工程工地上,...
失能老人的福音!这项保险在南宁... 瘫痪在床多年,吃喝拉撒全由家人照顾。第五次中国城乡老年人生活状况抽样调查显示,我国目前有约3500万...
伊朗与六国达成共识! 据路透社7月4日报道,亚洲中西部七国领导人峰会4日达成共识,将推动贸易自由化、吸引更多外国投资和建立...
灰度:加密友好型新立法或推动投... 吴说获悉,Grayscale 在 X 上发文表示,随着 GENIUS Act 等加密友好型新立法的推...