應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

智元機(jī)器人 GO-1 通用具身基座大模型開(kāi)源

2025-09-24 09:54 IT之家

導(dǎo)讀:智元機(jī)器人宣布,繼今年 1 月 AgiBot World 具身智能百萬(wàn)真機(jī)數(shù)據(jù)集開(kāi)源后,通用具身基座大模型 GO-1(Genie Operator-1)也正式在 GitHub 開(kāi)源。

9 月 23 日消息,智元機(jī)器人宣布,繼今年 1 月 AgiBot World 具身智能百萬(wàn)真機(jī)數(shù)據(jù)集開(kāi)源后,通用具身基座大模型 GO-1(Genie Operator-1)也正式在 GitHub 開(kāi)源。

智元機(jī)器人稱,這標(biāo)志著全球首個(gè)采用 Vision-Language-Latent-Action (ViLLA) 架構(gòu)的通用具身智能模型向全球開(kāi)發(fā)者免費(fèi)開(kāi)放,將極大降低具身智能的技術(shù)門檻,推動(dòng)行業(yè)快速發(fā)展。

附官方對(duì) GO-1 的介紹如下:

01、技術(shù)突破:ViLLA 架構(gòu)引領(lǐng)具身智能新范式

GO-1 采用的 Vision-Language-Latent-Action (ViLLA) 架構(gòu)是具身智能領(lǐng)域的重大技術(shù)突破。與傳統(tǒng)的 Vision-Language-Action (VLA) 架構(gòu)相比,ViLLA 通過(guò)引入隱式動(dòng)作標(biāo)記,成功彌合了圖像-文本輸入與機(jī)器人執(zhí)行動(dòng)作之間的語(yǔ)義鴻溝。這一創(chuàng)新使得機(jī)器人能夠更好地理解人類意圖,并將其轉(zhuǎn)化為精確的動(dòng)作執(zhí)行。

ViLLA 架構(gòu)的核心在于其三層協(xié)同設(shè)計(jì)。VLM 多模態(tài)理解層基于 InternVL-2B 構(gòu)建,能夠處理多視角視覺(jué)圖片、力覺(jué)信號(hào)、語(yǔ)言輸入等多模態(tài)信息,為整個(gè)系統(tǒng)提供強(qiáng)大的場(chǎng)景感知和指令理解能力。Latent Planner 隱式規(guī)劃器通過(guò)預(yù)測(cè)隱式動(dòng)作標(biāo)記,實(shí)現(xiàn)了對(duì)復(fù)雜操作任務(wù)的高層次規(guī)劃和理解。Action Expert 動(dòng)作專家則基于擴(kuò)散模型,能夠生成高頻率、高精度的連續(xù)動(dòng)作序列,確保機(jī)器人能夠執(zhí)行精細(xì)的操控任務(wù)。

02、平臺(tái)支持:Genie Studio 一站式開(kāi)發(fā)平臺(tái)

Genie Studio 是智元機(jī)器人專為具身智能場(chǎng)景打造的一站式開(kāi)發(fā)平臺(tái),為開(kāi)發(fā)者和合作伙伴提供全棧式解決方案,覆蓋數(shù)據(jù)采集、數(shù)據(jù)管理、模型訓(xùn)練與微調(diào)、仿真評(píng)測(cè)、模型構(gòu)建與部署等全流程。平臺(tái)提供開(kāi)箱即用的 GO-1 基座模型,集成 Video Traning 方案和統(tǒng)一訓(xùn)練框架,內(nèi)置完整的開(kāi)發(fā)工具鏈,可實(shí)現(xiàn)真機(jī)一鍵編譯 & 部署,顯著提升開(kāi)發(fā)效率,助力具身智能技術(shù)的快速落地與應(yīng)用。

官網(wǎng)入口

https://genie.agibot.com/geniestudio

購(gòu)買咨詢

https://www.zhiyuan-robot.com/Contact/Business

03、社區(qū)共建:打造開(kāi)源社區(qū)生態(tài)

雖然 GO-1 僅基于 AgiBot G1 機(jī)器人數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,但該模型已經(jīng)在松靈機(jī)器人、方舟機(jī)器人、Franka 機(jī)械臂等不同本體上進(jìn)行了充分的驗(yàn)證測(cè)試。這些跨本體驗(yàn)證結(jié)果表明,GO-1 具備良好的可移植性,能夠適應(yīng)不同機(jī)器人的運(yùn)動(dòng)學(xué)特性和控制接口。

在仿真環(huán)境測(cè)試方面,GO-1 在 Genie Sim 和 Libero 等主流仿真平臺(tái)上均取得了領(lǐng)先的性能表現(xiàn)。

針對(duì)真機(jī)部署場(chǎng)景,GO-1 模型充分考慮了用戶多樣化的機(jī)器人平臺(tái)需求,不僅提供了 Genie Studio 一站式開(kāi)發(fā)平臺(tái)來(lái)支持 Genie G1 本體的數(shù)據(jù)采集、模型微調(diào)和部署,同時(shí)特別集成了通用 LeRobot 數(shù)據(jù)格式,支持其他機(jī)器人本體的數(shù)據(jù)采集、模型微調(diào)和部署。

通過(guò) Genie Studio,在 Genie G1 真機(jī)實(shí)驗(yàn)中,GO-1 相比于其他 SOTA 模型也取得了領(lǐng)先的性能。