Copyright 2017-2025 北方報 版權所有 京ICP備16071829-1號
你斥巨資買回家的全能家務機器人,正在執行“把藥片拿給奶奶”的任務。
它在大腦里推理得有條有理:“奶奶在沙發上,藥在茶幾,我要先去茶幾那……”
結果站在茶幾前的它,對著上面的半瓶可樂陷入了沉思。
短暫的停頓之后,機械臂伸出,抓起了遙控器。
恭喜你!你家的具身機器人翻車了。
其實,“一旦被扔進物理世界做任務,智商立刻欠費”是具身智能機器人當下的尷尬現狀。
因為缺乏對三維物理空間的感知,模型無法像人類一樣建立空間坐標系,無法記住剛剛轉身后背對著的物體,也無法判斷目標是否仍然存在于空間中。
這種“腦子學會了,手跟不上”的現象,本質上是因為現有的大模型大多是“缸中之腦”,它們只見過二維的圖片和文本,從未真正理解過物理世界的深度與連續性。
現在,阿里達摩院出手了。
今天,達摩院開源了RynnBrain具身大腦基礎模型,從2B到30B,全系列共計7個。
這是業界首個擁有時空記憶的具身大腦基礎模型,其最大的特點是給具身機器人裝上了一個能理解“時”與“空”的大腦:它不僅能看懂現在的畫面,還能記住過去的軌跡,甚至預判未來的動作。
在20項具身Benchmark上,RynnBrain全面超越了英偉達的Cosmos-reason2和谷歌的Gemini Robotics ER 1.5等頂尖模型,輕松實現16個SOTA。