“拿起達(dá)斯·維達(dá)光劍顏色的盒子,把它放在最高的那堆盒子上面,”敏捷的鳥腿綠色人形機(jī)器人迪吉特站在一個(gè)堆滿各種高度和顏色的盒子的房間里,收到指令。迪吉特一動(dòng)不動(dòng)地站著,等待系統(tǒng)處理語音指令。最后,他拿起紅色的盒子,小心翼翼地把它放在最高的那堆盒子上面。
對(duì)于機(jī)器人來說,拿起一個(gè)盒子并將其整齊地堆放起來本身并不是什么了不起的動(dòng)作;然而,理解人類的神秘命令、正確解讀并執(zhí)行它,卻是一項(xiàng)意義非凡的創(chuàng)新。Digit 的進(jìn)步部分歸功于生成式人工智能革命,這場(chǎng)革命也已延伸到機(jī)器人領(lǐng)域,顛覆了人們的預(yù)期?!坝腥藛栁?,除了語言建模之外,2024 年最大的熱門是什么?答案是機(jī)器人技術(shù)。就是這樣。” Nvidia 高級(jí)人工智能科學(xué)家 Jim Fan 在 12 月寫道。“我們距離實(shí)體人工智能代理的 ChatGPT 時(shí)刻還有大約三年的時(shí)間?!?他解釋道。
Nvidia 首席執(zhí)行官黃仁勛與機(jī)器人 (圖片:美聯(lián)社)
自從范發(fā)表這番言論以來,似乎每個(gè)人都在談?wù)摗皺C(jī)器人領(lǐng)域的ChatGPT時(shí)刻”,指的是預(yù)期中的技術(shù)突破,它可能會(huì)推動(dòng)該領(lǐng)域的發(fā)展,最終讓我們的家中充滿智能人形機(jī)器人,幫助人們做家務(wù),比如擦地、擺桌子或洗衣服(但不包括疊衣服)?!白罱鼛讉€(gè)月發(fā)生的事情令人矚目,”R-Go Robotics首席執(zhí)行官阿米爾·布薩尼(Amir Bousani)解釋道。該公司最近與英偉達(dá)(Nvidia)合作,為其正在開發(fā)的機(jī)器人配備空間感知能力。“現(xiàn)實(shí)世界比互聯(lián)網(wǎng)更難理解,”艾倫人工智能研究所(Allen Institute for Artificial Intelligence)創(chuàng)始首席執(zhí)行官奧倫·埃齊奧尼(Oren Etzioni)博士指出,“但如今,具有通用行為能力的機(jī)器人領(lǐng)域的發(fā)展速度要快得多?!?/p>
人們對(duì)范提到的人形機(jī)器人(或稱類人機(jī)器人)的巨大興趣,從該領(lǐng)域不斷發(fā)布的公告中可見一斑:2月,初創(chuàng)公司Figure從杰夫·貝佐斯、英偉達(dá)和OpenAI籌集了6.75億美元,用于開發(fā)類人機(jī)器人。3月,英偉達(dá)首席執(zhí)行官在公司開發(fā)者大會(huì)上與來自不同公司的九位類人機(jī)器人一同亮相,并宣布為機(jī)器人構(gòu)建模型是“人工智能領(lǐng)域最令人興奮的難題之一”;4月,埃隆·馬斯克承諾將于明年推出他正在開發(fā)的人形機(jī)器人——擎天柱(Optimus),并預(yù)測(cè)到2040年,我們身邊將有10億個(gè)類人機(jī)器人。不久之后,由阿姆農(nóng)·沙舒亞(Amnon Shashua)兩年前創(chuàng)立的、同樣致力于開發(fā)類人機(jī)器人的Mentee Robotics公司也正式上市。與此同時(shí),波士頓動(dòng)力公司發(fā)布了一段視頻,展示了其新款類人機(jī)器人Atlas,這次Atlas由電力驅(qū)動(dòng);Agility宣布預(yù)計(jì)將開始銷售用于倉庫工作的Digit。而在 5 月底,OpenAI 明確表示認(rèn)為之前的投資不足,將重新建立于 2021 年 7 月關(guān)閉的機(jī)器人部門??傮w而言,研究公司 Insights 估計(jì),自 2020 年以來,已有 23 億美元流入了制造人形機(jī)器人的初創(chuàng)公司。
“機(jī)器人”一詞涵蓋了各種自動(dòng)化設(shè)備,從制造業(yè)使用的機(jī)械臂到無人機(jī)、自動(dòng)駕駛汽車和吸塵器。它們大多融入了人工智能,并被編程為在受控環(huán)境或人工監(jiān)督下執(zhí)行特定任務(wù)。但其目標(biāo)始終是打造最自主的設(shè)備,使其能夠適應(yīng)環(huán)境、獨(dú)立學(xué)習(xí)新事物,并針對(duì)各種需求做出快速合理的決策。沒有哪個(gè)機(jī)器人比人形機(jī)器人更能體現(xiàn)這一雄心壯志,如今人形機(jī)器人備受矚目,主要原因有兩個(gè)——一個(gè)是實(shí)用性,另一個(gè)是想象力。如果我們想讓機(jī)器人做所有我們不想做的事情,無論是在家里、倉庫還是工廠,就必須讓機(jī)器人適應(yīng)房屋,而不是讓房屋適應(yīng)機(jī)器人;通常情況下,腿部和人體結(jié)構(gòu)最適合我們?yōu)樽约簶?gòu)建的物理環(huán)境。另一方面,類人生物簡(jiǎn)直令人著迷,發(fā)人深省——這是艾薩克·阿西莫夫和菲利普·迪克幾十年前為我們想象的事物,也是電影通過《星球大戰(zhàn)》中的 C-3PO 或《星際迷航》中的 Data 等角色所展現(xiàn)的事物。
“機(jī)器人的外觀預(yù)示著它能做什么以及它有多智能。它必須兌現(xiàn)甚至超越這個(gè)承諾,否則機(jī)器人將不會(huì)被接受,”麻省理工學(xué)院機(jī)器人專家、iRobot創(chuàng)始人羅德尼·布魯克斯(Rodney Brooks)最近說道。布魯克斯將這一原則稱為“機(jī)器人學(xué)第一法則”,這是對(duì)阿西莫夫在1941年小說中概述的規(guī)則的詮釋。該領(lǐng)域的公司深諳此道,他們通過精心剪輯的視頻向我們展現(xiàn)了美好的未來:無論是雙腿站立的阿特拉斯,還是正在澆灌植物的擎天柱,這些充滿目標(biāo)感的展示都激發(fā)了公眾的想象力和投資者的興趣。
實(shí)際上,這些演示僅僅是演示而已。“當(dāng)你看到機(jī)器人技術(shù)走向?qū)嶋H應(yīng)用時(shí),你必須記住,必須有人對(duì)機(jī)器人的每個(gè)細(xì)節(jié)、每個(gè)極端情況以及所有可能發(fā)生的情況進(jìn)行編碼,”布薩尼指出。馬斯克本人在今年一月在X上發(fā)布了一段名為“擎天柱疊衣服”的視頻后,也提醒了我們這一點(diǎn)。這段帖子和視頻或許會(huì)讓人誤以為,這個(gè)機(jī)器人終于能夠自主完成枯燥的家務(wù)了!但眼尖的觀眾注意到,一只人手有時(shí)會(huì)出現(xiàn)在機(jī)器人的右上角,從遠(yuǎn)處控制著它,這迫使馬斯克不得不補(bǔ)充說明:“重要提示:擎天柱目前還不能自主完成這項(xiàng)工作,但它肯定能夠在任意環(huán)境下完全自主地完成?!碑?dāng)然,馬斯克并非孤軍奮戰(zhàn);七年多前,波士頓動(dòng)力公司發(fā)布了其正在研發(fā)的人形機(jī)器人的第一段視頻,但至今尚未向公眾推出任何一款人形機(jī)器人。
多年來,由于開發(fā)人形機(jī)器人是一項(xiàng)極其復(fù)雜的任務(wù),外觀與預(yù)期之間的差距一直存在。但現(xiàn)在,該領(lǐng)域似乎正處于飛躍的邊緣,人們普遍認(rèn)為重大進(jìn)展即將到來。點(diǎn)燃這種希望的是像ChatGPT這樣的語言模型,它首次將人工智能變成了一項(xiàng)終端消費(fèi)者可直接使用的技術(shù)。乘著這股熱潮,企業(yè)家們?nèi)缃癯兄Z將同樣的能力從虛擬世界帶到現(xiàn)實(shí)世界,開發(fā)“用于一般任務(wù)的機(jī)器人”。想象一下現(xiàn)實(shí)世界中的ChatGPT:就像機(jī)器人可以在無需事先了解虛擬互動(dòng)發(fā)起者的情況下執(zhí)行各種各樣的任務(wù),從寫詩、總結(jié)文章到轉(zhuǎn)錄對(duì)話一樣,人形機(jī)器人也可以響應(yīng)任何請(qǐng)求,即使它包含神秘的元素并且處于未知的環(huán)境中——例如將衣物放入大衣柜、為您送來一罐冷汽水、清空洗碗機(jī),或者為“披薩”之夜擺好餐桌。
人工智能公司Figure AI的人形機(jī)器人 (圖片:AI圖)
制造商:Figure AI
國(guó)家: 美國(guó)
成立年份:2022年
身高:167厘米
重量:60公斤
速度:每秒1.2米
最新車型上市時(shí)間:2024年3月
估價(jià):3萬至15萬美元
數(shù)字
Agility 的數(shù)字機(jī)器人 (圖片:Agility)
制造商: Agility Robotics
國(guó)家: 美國(guó)
成立年份:2015年
身高:175厘米
體重:63公斤
速度:每秒1.5米
最新車型上市時(shí)間:2024年2月
以每小時(shí) 10-12 美元的價(jià)格租給亞馬遜
MenteeBot
Mentee Robotics 的 MenteeBot 機(jī)器人 (圖片:MenteeBot)
制造商:Mentee Robotics
國(guó)家: 以色列
成立年份:2022年
身高:175厘米
重量:70公斤
速度:每秒1.5米
公開時(shí)間:2024年4月
阿特拉斯
Atlas機(jī)器人 (圖片:Boston Dynamics.com)
制造商:波士頓動(dòng)力公司
國(guó)家: 美國(guó)
成立年份:1992年
身高:150厘米
體重:89公斤
速度:每秒2.5米
最新車型上市時(shí)間:2024年3月
擎天柱 -第二代
Optimus - Gen 2,特斯拉第二代擎天柱機(jī)器人 (圖片:特斯拉)
制造商:特斯拉
國(guó)家: 美國(guó)
成立年份:2003年
身高:173厘米
重量:60公斤
速度:0.6米/秒
公開披露時(shí)間:2023年12月
估價(jià):3萬美元
宇樹 H1
宇樹 H1 (圖片:Unitree)
國(guó)家:中國(guó)
成立年份:2016年
身高:180厘米
重量:47公斤
速度:每秒3.3米
最新車型上市時(shí)間:2024年3月
估價(jià):9萬美元
新的訓(xùn)練方法
多年來,電動(dòng)汽車和自動(dòng)駕駛汽車領(lǐng)域的發(fā)展推動(dòng)了機(jī)器人技術(shù)的進(jìn)步。這些進(jìn)步擴(kuò)大了電池的續(xù)航里程,改進(jìn)了計(jì)算機(jī)視覺,并極大地促進(jìn)了理解如何讓機(jī)器人執(zhí)行諸如爬樓梯、識(shí)別物體或在滑倒時(shí)保持平衡等任務(wù)。然而,我們所看到的類人機(jī)器人所做的所有動(dòng)作背后都隱藏著一個(gè)公開的秘密——每個(gè)動(dòng)作都經(jīng)過精心規(guī)劃,并基于一長(zhǎng)串具體的操作步驟。你所看到的只是實(shí)驗(yàn)室實(shí)驗(yàn)的成果,直到機(jī)器人能夠完美地執(zhí)行這些規(guī)劃好的動(dòng)作。
這種學(xué)習(xí)需要大量時(shí)間,而且難以適應(yīng)機(jī)器人可能遇到的所有極端情況。在需要巨大行動(dòng)自由的機(jī)器人系統(tǒng)中,構(gòu)建一個(gè)能夠在不受控制的環(huán)境中工作的類人機(jī)器人實(shí)在太復(fù)雜了。正因如此,那些能夠在野外獨(dú)立操作且物理能力非常有限的機(jī)器人——無人機(jī)、吸塵器和機(jī)器人服務(wù)員——正處于發(fā)展的前沿。類人機(jī)器人現(xiàn)在才剛剛能夠在倉庫或?qū)嶒?yàn)室等嚴(yán)格受控的環(huán)境中邁出第一步。
但近年來,新技術(shù)已進(jìn)入機(jī)器人領(lǐng)域,有望帶來重大變革,其中首當(dāng)其沖的是“強(qiáng)化學(xué)習(xí)”。這是一種自主學(xué)習(xí)方法,機(jī)器人會(huì)嘗試完成分配給它的任務(wù),如果成功,系統(tǒng)會(huì)給予“獎(jiǎng)勵(lì)”,如果失敗,則會(huì)遭受“損失”。同時(shí),開發(fā)人員使用不同的訓(xùn)練方法,例如“模仿學(xué)習(xí)”,他們給人類穿上特殊的服裝,然后學(xué)習(xí)人類執(zhí)行的整套身體動(dòng)作,并將訓(xùn)練結(jié)果傳遞給機(jī)器人。隨著時(shí)間的推移,新的龐大數(shù)據(jù)庫被建立起來,每個(gè)動(dòng)作都被數(shù)字化,并用于訓(xùn)練未來的機(jī)器人。
然而,這些在海量數(shù)據(jù)庫中積累經(jīng)驗(yàn)的學(xué)習(xí)方法耗時(shí)長(zhǎng),應(yīng)用范圍有限。而這正是人工智能飛躍式發(fā)展的關(guān)鍵所在,它使機(jī)器即使在從未遇到過的情況下也能獨(dú)立完成任務(wù)。背后的秘密隱藏在像 ChatGPT 這樣的語言模型中,它們只不過是根據(jù)初始命令生成單詞的引擎。它們無法理解單詞的含義,也無法將積累的知識(shí)應(yīng)用于現(xiàn)實(shí)世界。但推動(dòng)它們發(fā)展的突破也適用于機(jī)器人領(lǐng)域。這主要體現(xiàn)在能夠分析大量示例(在本例中是人類語音示例)的能力,以及借助學(xué)習(xí)算法理解上下文并對(duì)各種問題給出連貫的答案的能力。
現(xiàn)在,人工智能公司正試圖利用這些能力在現(xiàn)實(shí)世界中訓(xùn)練機(jī)器人。要做到這一點(diǎn),人工智能必須達(dá)到一定的理解水平,使其能夠在現(xiàn)實(shí)世界中接受訓(xùn)練,就像學(xué)習(xí)人類語言一樣。為此,它必須掃描大量現(xiàn)實(shí)世界的案例,捕捉其背后的含義,并理解物體和任務(wù)之間的差異。這將使它能夠進(jìn)行自我訓(xùn)練,并將知識(shí)傳遞給其他機(jī)器人。這項(xiàng)技術(shù)飛躍的目標(biāo)并非讓任何機(jī)器人都能執(zhí)行任何任務(wù),而是讓機(jī)器人能夠更快地移動(dòng)和適應(yīng)新環(huán)境,并相互訓(xùn)練以執(zhí)行任務(wù)——例如ChatGPT能夠與人類互動(dòng)并理解對(duì)話上下文。如果這些能力能夠用于人形機(jī)器人的開發(fā),將帶來重大的飛躍。這項(xiàng)技術(shù)突破已經(jīng)在英偉達(dá)開發(fā)的機(jī)器人學(xué)習(xí)平臺(tái)上得到了驗(yàn)證,該平臺(tái)目前已被許多機(jī)器人公司使用,使機(jī)器人能夠在虛擬世界中相互訓(xùn)練并獲得更多技能。
然而,普通機(jī)器人要達(dá)到人類的期望并充分發(fā)揮類人機(jī)器人所蘊(yùn)含的潛力,還有很長(zhǎng)的路要走?!耙恍┏鮿?chuàng)公司聲稱他們正在打造具有通用行為能力的類人機(jī)器人,”Etzioni 博士指出,“但事實(shí)是,我們距離目標(biāo)還很遠(yuǎn)?!?要實(shí)現(xiàn)預(yù)期的突破,需要一系列目前尚不具備的能力和創(chuàng)新。例如,該領(lǐng)域的主要挑戰(zhàn)仍然是提高能源和電池效率以支持長(zhǎng)時(shí)間運(yùn)行,開發(fā)柔性材料以實(shí)現(xiàn)更像人類的運(yùn)動(dòng),以及開發(fā)更強(qiáng)大的傳感器來模擬人類的觸覺和聽覺等感官。
真正能夠自主執(zhí)行復(fù)雜任務(wù)的人形機(jī)器人仍在研發(fā)中,但該領(lǐng)域的最新進(jìn)展已使這一愿景更接近現(xiàn)實(shí)。人工智能、機(jī)器人技術(shù)和人機(jī)交互技術(shù)的協(xié)同發(fā)展,為未來鋪平了道路,機(jī)器人將成為日常生活中不可或缺的一部分,協(xié)助完成日常和復(fù)雜的任務(wù)。
2025-09-06 10:33
2025-09-06 10:24
2025-09-06 10:23
2025-09-06 10:21
2025-09-06 10:03
2025-09-06 08:27
2025-09-05 09:20
2025-09-05 09:19
2025-09-05 09:18
2025-09-05 09:16