亞馬遜“盲眼”機(jī)器人30秒跑酷首秀驚艷!華人學(xué)者領(lǐng)銜
你見過這樣的盲眼“盲眼”機(jī)器人demo嗎?
它在完全看不見的情況下——沒有攝像頭、雷達(dá)或任何感知單元——主動(dòng)搬起9斤重的亞馬艷華椅子,爬上1米高的遜機(jī)秀驚銜叼嘿視頻軟件下載官方桌子,然后翻跟頭跳下。器人
不光耍酷,秒跑干起活來,酷首搬箱子也不在話下。人學(xué)
還能一個(gè)猛子跳上桌子。盲眼
手腳并用爬坡也照樣OK。亞馬艷華
這些絲滑小連招來自亞馬遜機(jī)器人團(tuán)隊(duì)FAR(Frontier AI for Robotics)發(fā)布的遜機(jī)秀驚銜首個(gè)人形機(jī)器人(足式)研究成果——OmniRetarget!
OmniRetarget使強(qiáng)化學(xué)習(xí)策略能夠在復(fù)雜環(huán)境中學(xué)習(xí)長時(shí)程的器人“移-操一體”(loco-manipulation)技能,并實(shí)現(xiàn)從仿真到人形機(jī)器人的秒跑零樣本遷移。
網(wǎng)友表示:又能跑酷、酷首還能干活,人學(xué)這不比特斯拉的盲眼擎天柱強(qiáng)10倍?
接下來,讓我們一起看看他們是怎么做到的吧!
基于交互網(wǎng)格的動(dòng)作重定向方法
總的來說,OmniRetarget是叼嘿視頻軟件下載官方一個(gè)開源的數(shù)據(jù)生成引擎,它將人類演示轉(zhuǎn)化為多樣化、高質(zhì)量的運(yùn)動(dòng)學(xué)參考,用于人形機(jī)器人的全身控制。
與通常忽略人-物體/環(huán)境之間豐富的交互關(guān)系的動(dòng)作重定向方法不同,OmniRetarget通過一個(gè)交互網(wǎng)格(interaction mesh)來建模機(jī)器人、物體和地形之間的空間和接觸關(guān)系,從而保留了必要的交互并生成運(yùn)動(dòng)學(xué)可行的變體。
此外,保留任務(wù)相關(guān)的交互使得數(shù)據(jù)能夠進(jìn)行高效的數(shù)據(jù)增強(qiáng),進(jìn)而從單個(gè)演示推廣到不同的機(jī)器人本體、地形和物體配置,以減少不同變體的數(shù)據(jù)收集成本。
在與其他動(dòng)作重定向方法的對比中,OmniRetarget在所有關(guān)鍵方面:硬約束、物體交互、地形交互、數(shù)據(jù)增強(qiáng)表現(xiàn)出了全面的方法優(yōu)勢。
接下來就讓我們具體來看。
首先,OmniRetarget通過基于交互網(wǎng)格(interaction-mesh)的約束優(yōu)化,將人類示范動(dòng)作映射到機(jī)器人上。
在研究中,交互網(wǎng)格被定義為一個(gè)體積結(jié)構(gòu),用于保持身體部位、物體與環(huán)境之間的空間關(guān)系。
交互網(wǎng)格的頂點(diǎn)由關(guān)鍵的機(jī)器人或人類關(guān)節(jié)以及從物體和環(huán)境中采樣的點(diǎn)組成。
通過收縮或拉伸該網(wǎng)格,研究可以在保持相對空間結(jié)構(gòu)和接觸關(guān)系的前提下,將人類動(dòng)作映射到機(jī)器人上。
在交互網(wǎng)格的構(gòu)建過程中,研究人員對用戶定義的關(guān)鍵關(guān)節(jié)位置以及隨機(jī)采樣的物體和環(huán)境點(diǎn)應(yīng)用德勞內(nèi)四面體化(Delaunay tetrahedralization)。
(注:為了更精確地保持接觸關(guān)系,物體和環(huán)境表面的采樣密度高于身體關(guān)節(jié)的采樣密度。)
研究通過最小化源動(dòng)作(人類示范關(guān)鍵點(diǎn)及對象/環(huán)境采樣點(diǎn))與目標(biāo)動(dòng)作(機(jī)器人對應(yīng)關(guān)鍵點(diǎn)及相同對象/環(huán)境點(diǎn))之間的拉普拉斯形變能(Laplacian deformation energy),讓機(jī)器人動(dòng)作盡量保持與人類示范一致的空間和接觸關(guān)系。
拉普拉斯坐標(biāo)衡量每個(gè)關(guān)鍵點(diǎn)與其鄰居點(diǎn)之間的相對關(guān)系,從而在重定向動(dòng)作時(shí)保留局部空間結(jié)構(gòu)和接觸關(guān)系。
在每個(gè)時(shí)間幀,算法通過求解約束非凸優(yōu)化問題來獲得機(jī)器人配置,包括浮動(dòng)底座的姿態(tài)和平移以及所有關(guān)節(jié)角度,同時(shí)滿足碰撞避免、關(guān)節(jié)和速度限制,以及防止支撐腳滑動(dòng)等硬約束。
優(yōu)化則使用順序二次規(guī)劃風(fēng)格的迭代方法,每幀以上一幀的最優(yōu)解作為初值,以保證時(shí)間上的連續(xù)性和平滑性。
由此,基于交互網(wǎng)格的方法可適配不同機(jī)器人形態(tài)和多種交互類型,只需調(diào)整交互網(wǎng)格中的關(guān)鍵點(diǎn)對應(yīng)關(guān)系和碰撞模型。
其次,每一次空間和形狀的增強(qiáng)都被視為一個(gè)新的優(yōu)化問題,從而生成多樣化的軌跡。
具體來說,OmniRetarget通過參數(shù)化地改變物體配置、形狀或地形特征,將單個(gè)人類演示轉(zhuǎn)化為豐富多樣的數(shù)據(jù)集。
對于每個(gè)新場景,研究都會使用固定的源動(dòng)作集和增強(qiáng)后的目標(biāo)動(dòng)作集重新求解優(yōu)化問題:通過最小化交互網(wǎng)格的形變,可以得到一組新的、運(yùn)動(dòng)學(xué)上有效的機(jī)器人動(dòng)作,同時(shí)保留原始交互中的基本空間結(jié)構(gòu)和接觸關(guān)系。
在機(jī)器人-物體的交互中,研究通過增強(qiáng)物體的空間位置和形狀來生成多樣化的交互(位姿和平移進(jìn)行增強(qiáng),并在局部坐標(biāo)系中構(gòu)建交互網(wǎng)格)。
為避免整個(gè)機(jī)器人隨物體發(fā)生簡單剛體變換,研究還在優(yōu)化中加入約束,將下半身固定到標(biāo)稱軌跡,同時(shí)允許上半身探索新的協(xié)調(diào)方式,從而生成真正多樣化的交互動(dòng)作。
在機(jī)器人-地形的交互中,研究通過改變平臺的高度和深度,并引入額外約束來生成多樣化的地形場景。
最后,在建立了高質(zhì)量運(yùn)動(dòng)學(xué)參考的方法之后,研究使用強(qiáng)化學(xué)習(xí)來彌補(bǔ)動(dòng)力學(xué)差異,即訓(xùn)練一個(gè)低層策略,將這些軌跡轉(zhuǎn)化為物理可實(shí)現(xiàn)的動(dòng)作,實(shí)現(xiàn)從仿真到硬件的零次遷移。
得益于干凈且保留交互的參考數(shù)據(jù),OmniRetarget僅需最小化獎(jiǎng)勵(lì)即可高保真跟蹤,無需繁瑣調(diào)參。
訓(xùn)練時(shí),機(jī)器人無法直接感知明確的場景和物體信息,僅依賴本體感知和參考軌跡作為復(fù)雜任務(wù)的先驗(yàn)知識:
參考動(dòng)作: 參考關(guān)節(jié)位置/速度,參考骨盆位置/方向誤差
本體感受 : 骨盆線速度/角速度,關(guān)節(jié)位置/速度
先前動(dòng)作: 上一時(shí)間步的策略動(dòng)作
在獎(jiǎng)勵(lì)方面,研究使用五類獎(jiǎng)勵(lì)(身體跟蹤、物體跟蹤、動(dòng)作速率、軟關(guān)節(jié)限制、自碰撞)來保證動(dòng)作質(zhì)量,同時(shí)結(jié)合物體參數(shù)和機(jī)器人狀態(tài)的領(lǐng)域隨機(jī)化提升泛化能力。
此外,相似動(dòng)作會分組訓(xùn)練以加快策略收斂,不同的任務(wù)(如搬箱和平臺攀爬)則采用不同策略設(shè)置。
實(shí)驗(yàn)結(jié)論
在實(shí)驗(yàn)方面,研究團(tuán)隊(duì)首先展示了OmniRetarget能實(shí)現(xiàn)的復(fù)雜行為的廣度,包括自然的物體操作和地形交互。
然后提供了針對最先進(jìn)基線的定量基準(zhǔn)測試,評估了在運(yùn)動(dòng)學(xué)質(zhì)量指標(biāo)和下游策略性能方面的表現(xiàn)。
正如我們開頭所展示的,搭載OmniRetarget的宇樹G1實(shí)現(xiàn)了一個(gè)類似波士頓動(dòng)力的跑酷動(dòng)作。
這個(gè)持續(xù) 30 秒、復(fù)雜的多階段任務(wù)突顯了OmniRetarget生成精確且通用參考動(dòng)作的能力。
在可擴(kuò)展性上,OmniRetarget在完整增強(qiáng)數(shù)據(jù)集上訓(xùn)練和評估成功率為79.1%,與僅使用標(biāo)稱動(dòng)作的82.2%相近,說明運(yùn)動(dòng)學(xué)增強(qiáng)在不顯著降低性能的情況下實(shí)質(zhì)性擴(kuò)大了動(dòng)作覆蓋范圍。
最后,研究團(tuán)隊(duì)將OmniRetarget與PHC、GMR和VideoMimic等開源重定向基線進(jìn)行了比較。
(注:實(shí)驗(yàn)使用OMOMO、內(nèi)部MoCap和LAFAN1數(shù)據(jù)集進(jìn)行評估)
實(shí)驗(yàn)結(jié)果顯示,在運(yùn)動(dòng)學(xué)質(zhì)量上,OmniRetarget在穿透、腳部打滑和接觸保留指標(biāo)上整體優(yōu)于所有基線,即使偶爾輕微穿透也能被 RL 修復(fù)。
下游強(qiáng)化學(xué)習(xí)策略評估表明,高質(zhì)量重定向動(dòng)作直接提升策略成功率,OmniRetarget在所有任務(wù)中均領(lǐng)先基線 10% 以上,且表現(xiàn)更穩(wěn)定。
One more thing
值得一提的是,OmniRetarget背后的Amazon FAR (Frontier AI & Robotics)成立僅七個(gè)多月,由華人學(xué)者領(lǐng)銜。
FAR的前身是著名機(jī)器人技術(shù)公司Covariant,創(chuàng)始人均為出自UCBerkeley的Pieter Abbeel、Peter Chen、Rocky Duan 和Tianhao Zhang。
(注:Pieter Abbeel是Rocky Duan和Tianhao Zhang的導(dǎo)師)
其中,Pieter Abbeel可謂是機(jī)器人領(lǐng)域的大佬,他是伯克利機(jī)器人學(xué)習(xí)實(shí)驗(yàn)室(Berkeley Robot Learning Lab)主任以及伯克利人工智能研究實(shí)驗(yàn)室(Berkeley AI Research, BAIR)的聯(lián)合主任。
早在去年8月,亞馬遜就與Covariant達(dá)成協(xié)議,獲得該公司技術(shù)的“非排他性”許可,聘用Covariant四分之一的員工,同時(shí)Covariant的創(chuàng)始人Pieter Abbeel、Peter Chen、和Rocky Duan也將加入亞馬遜。
目前,由Rocky Duan擔(dān)任Amazon FAR研究負(fù)責(zé)人。
而OmniRetarget這次令人驚艷的亮相,正是Amazon FAR 在人形機(jī)器人(足式)領(lǐng)域的首次嘗試。
不得不說,亞馬遜(Amazon)的機(jī)器人,真的有點(diǎn)驚艷(Amazing)。
已經(jīng)開始期待他們之后的工作了!
相關(guān)文章:
- 中甲聯(lián)賽球員遭推撞受傷嚴(yán)重 廣西平果足球俱樂部發(fā)布通報(bào)
- 《黑暗世界:因與果》耕升RTX 5070 追風(fēng) OC踏入扭曲的黑暗
- 微信存儲一下就少了10G引熱議 博主分享清理技巧
- 訊飛雙屏翻譯機(jī)2.0領(lǐng)銜 科大訊飛發(fā)布系列東盟版AI新品
- 三名科學(xué)家獲得2025年諾貝爾物理學(xué)獎(jiǎng)
- 全員20薪不意外!劉強(qiáng)東:企業(yè)有利潤 就要給所有員工升職加薪
- 為青春加點(diǎn)“AI”:英特爾攜手微軟、京東助力高校學(xué)子開啟智能學(xué)習(xí)新方式
- 技嘉2025發(fā)布會:“從心出發(fā) 我們的主張”,邁向AI新紀(jì)元
- 小米汽車合金車模遭山寨!千萬別買錯(cuò) 官方僅有三種尺寸
- 格力再送12名員工參軍報(bào)國 董明珠現(xiàn)場哽咽發(fā)聲:激動(dòng)又難舍
相關(guān)推薦:
- (文化中國行)高浮雕傳拓 “3D打印術(shù)”拓古今
- 阿里開源通義DeepResearch:登頂開源Agent模型榜首 性能超OpenAI、DeepSeek旗艦
- 騰訊《暗區(qū)突圍》重磅落子 鴻蒙游戲生態(tài)的“飛輪效應(yīng)”正在加速
- AI賦能汽車金融全鏈路 易鑫“智”取“直通烏鎮(zhèn)”決賽席位
- (校館弦歌)北京大學(xué)賽克勒考古與藝術(shù)博物館:文明的守望與傳承
- 搭載紫光展銳W517 大朋AI眼鏡全新上市
- 寧德時(shí)代曾毓群:不少企業(yè)傾向于抄襲和復(fù)制
- 下單可享3期免息福利 來京東先人一步嘗鮮H3C MegaBook更劃算
- EA暗示《戰(zhàn)地6》加入海戰(zhàn)!內(nèi)容量史上最大
- 騰訊市值重回6萬億!3年漲幅近3倍
- 中國首位!00后高位截癱女孩徒手登頂泰山:用時(shí)55小時(shí)
- 臺胞中秋寫真:月滿十六別樣圓 半退休生活續(xù)寫兩岸情
- 天花板級標(biāo)桿畫質(zhì)!當(dāng)貝S7 Ultra Pro家庭電影機(jī)官宣
- 又雙叒叕有日本科學(xué)家!2025諾貝爾化學(xué)獎(jiǎng)三位得主帶來一場材料學(xué)革命
- 裸膚觸感 寢迪妃深睡 Pro3.0控溫四季被 129.9元起
- 比配料表更重要的表 9成的人卻從來不看
- 40W充電頭賣329!蘋果新快充用的AVS是啥玩意兒
- 王者榮耀崩了,官方回應(yīng):我們正在定位中,將盡快修復(fù)上線
- 裸膚觸感 寢迪妃深睡 Pro3.0控溫四季被 129.9元起
- iPhone 17e明年亮相:劉海屏退出歷史舞臺