亞洲資本網(wǎng) > 關(guān)注 > 正文
人形機(jī)器人+大模型,為什么是投資人追逐的新風(fēng)口?|甲子光年
2023-09-01 07:29:59來(lái)源: 騰訊網(wǎng)
通用機(jī)器人來(lái)了?

作者|武靜靜

編輯|趙健


(資料圖)

“一個(gè)上午,接待了40多個(gè)投資人來(lái)現(xiàn)場(chǎng),都是來(lái)看人形機(jī)器人的。”一位追覓員工說(shuō)道。

有投資人指著正在表演咖啡拉花的機(jī)器人問(wèn):“這個(gè)動(dòng)作的難度在哪兒?”另一邊,一位自稱(chēng)開(kāi)煤礦的老板指的旁邊站立的另一臺(tái)人形機(jī)器人問(wèn):“多少錢(qián),怎么訂?”

2023世界機(jī)器人大會(huì)上,以前只能在科幻電影中出現(xiàn)的人形機(jī)器人在現(xiàn)場(chǎng)表演起了各種技能。小米、追覓科技、優(yōu)必選、達(dá)闥科技、宇樹(shù)科技、大連蒂艾斯科技、星動(dòng)紀(jì)元、理工華匯等很多公司都把自己的人形機(jī)器人搬到了現(xiàn)場(chǎng)。

大連蒂艾斯科技展示的人形機(jī)器人,甲子光年現(xiàn)場(chǎng)拍攝

這是2023世界機(jī)器人大會(huì)上熱鬧的一角。今年的大會(huì),160家國(guó)內(nèi)外機(jī)器人企業(yè),600件機(jī)器人都在現(xiàn)場(chǎng)久違的大秀了一把肌肉。人形機(jī)器人搶走了大部分風(fēng)頭。全球知名的波士頓動(dòng)力創(chuàng)始人Marc Raibert、日本知名機(jī)器人學(xué)者石黑浩都來(lái)了。

人形機(jī)器人正在成為資本市場(chǎng)的新熱點(diǎn)。一級(jí)市場(chǎng),BV百度風(fēng)投、經(jīng)緯、高瓴、鼎暉、高榕、云啟、真格、梅花創(chuàng)投等都在一線(xiàn)積極調(diào)研,前半年聊大模型的風(fēng)投現(xiàn)在沒(méi)有人不關(guān)心通用機(jī)器人。

目前國(guó)內(nèi)外已經(jīng)有一些出手的案例:

美國(guó)人形機(jī)器人創(chuàng)業(yè)公司Figure兩個(gè)月就完成了兩輪融資:7月獲得了英特爾投資的900萬(wàn)美元投資;今年5月,F(xiàn)igure完成了7000萬(wàn)美元A輪融資,由Parkway Venture Capital領(lǐng)投。根據(jù)路透社報(bào)道,在5月融資時(shí),Figure估值已經(jīng)超過(guò)4億美元。

國(guó)內(nèi)市場(chǎng),曾經(jīng)的華為天才少年稚暉君創(chuàng)立的智元機(jī)器人(Agibot)也正在受到一線(xiàn)基金的追捧,BV百度風(fēng)投、經(jīng)緯、高瓴、鼎暉、高榕等均參與了投資。

近日,通用機(jī)器人公司月泉仿生也完成了一輪由北京北科中發(fā)展啟航創(chuàng)業(yè)投資基金的獨(dú)家投資。月泉仿生的核心業(yè)務(wù)是通用型仿生人形機(jī)器人及核心零部件的產(chǎn)業(yè)化。月泉仿生由吉林大學(xué)工程仿生教育部重點(diǎn)實(shí)驗(yàn)室任露泉院士團(tuán)隊(duì)創(chuàng)立。

二級(jí)市場(chǎng),人形機(jī)器人概念股都炒了幾波。5月,馬斯克在2023年股東大會(huì)上關(guān)于人形機(jī)器人Optimus的一番話(huà),直接拉漲了一波A股機(jī)器人概念——賽摩智能20CM漲停,豐立智能在六個(gè)交易日漲幅近160%,直接引發(fā)了深交所的關(guān)注,要求說(shuō)明股價(jià)漲幅較大的原因及合理性。

為何人形機(jī)器人成為了香餑餑?投資人扎堆調(diào)研的背后,人形機(jī)器人面臨哪些機(jī)會(huì)和挑戰(zhàn)?

1.特斯拉、小米、追覓熱火朝天的人形機(jī)器人

特斯拉是這波人形機(jī)器人熱潮的直接推動(dòng)者。

在2023年股東大會(huì)上,馬斯克說(shuō),人形機(jī)器人Optimus對(duì)運(yùn)動(dòng)和力量的控制以及環(huán)境感知方面有顯著加強(qiáng),技術(shù)正在快速迭代。他預(yù)測(cè),機(jī)器人的需求可能會(huì)達(dá)到100億,甚至更多。如果以人類(lèi)和機(jī)器人的比例為2:1,那么對(duì)人形機(jī)器人的需求可能會(huì)遠(yuǎn)遠(yuǎn)超過(guò)汽車(chē)的需求。

馬斯克的相信和投入點(diǎn)燃了很多人對(duì)人形機(jī)器人賽道的信心。

特斯拉有可能會(huì)推動(dòng)整個(gè)產(chǎn)業(yè)鏈走向成熟。梅花創(chuàng)投創(chuàng)始合伙人吳世春告訴「甲子光年」:“在新能源汽車(chē)產(chǎn)業(yè)鏈領(lǐng)域,特斯拉帶動(dòng)智能汽車(chē)產(chǎn)業(yè)鏈整體向前發(fā)展,它在上海的工廠帶動(dòng)了整個(gè)中國(guó)智能產(chǎn)業(yè)鏈的逐步成熟。下一個(gè)可能是人形機(jī)器人?!?/p>

“這是好事,我們也在觀察這個(gè)行業(yè)里哪些地方有投資機(jī)會(huì),可能是整機(jī)、零部件或軟件?!眳鞘来赫f(shuō)。

在特斯拉2022 AI Day活動(dòng)上,特斯拉人形機(jī)器人“Optimus”首次亮相,并在現(xiàn)場(chǎng)完成了自主行走、轉(zhuǎn)身、停止、揮手問(wèn)候等動(dòng)作。雖然在本屆機(jī)器人大會(huì)中沒(méi)有看到“Optimus”的身影,但在今年的世界人工智能大會(huì)上,我們?cè)谏虾R?jiàn)到了一款在櫥窗里的“Optimus”。

甲子光年現(xiàn)場(chǎng)拍攝

“Optimus”采用了與汽車(chē)一致的計(jì)算機(jī)視覺(jué)、處理視覺(jué)數(shù)據(jù)、做出行動(dòng)決策、支持通信交流的“大腦”,以及與特斯拉車(chē)輛相同的芯片,還搭載與特斯拉車(chē)輛同源的FSD電腦以及Autopilot相關(guān)神經(jīng)網(wǎng)絡(luò)技術(shù),預(yù)計(jì)最終售價(jià)不超2萬(wàn)美元(約14.4萬(wàn)元人民幣)。

明勢(shì)資本創(chuàng)始合伙人黃明明認(rèn)為,電動(dòng)汽車(chē)公司做人形機(jī)器人有先天優(yōu)勢(shì)。“兩年前馬斯克要做Tesla Bot的時(shí)候,很多人覺(jué)得他不務(wù)正業(yè)。但如果仔細(xì)分析特斯拉的技術(shù)棧會(huì)發(fā)現(xiàn),機(jī)器人是電動(dòng)汽車(chē)的自然延伸。車(chē)是第一代的四輪機(jī)器人,理想汽車(chē)今年年初確定的愿景不是成為全球最大的電動(dòng)車(chē)企業(yè),而是成為最優(yōu)秀的人工智能和機(jī)器人公司?!?/p>

他提到,認(rèn)知型機(jī)器人是下一個(gè)巨大突破。“可能是人形,也可能是四足?,F(xiàn)在我們?cè)诠S、產(chǎn)線(xiàn)、物流已經(jīng)有各種各樣的機(jī)器人,但這些機(jī)器人的程序都是人類(lèi)工程師寫(xiě)好的,動(dòng)作是被我們固定好的。但是認(rèn)知型機(jī)器人和自動(dòng)駕駛一樣,有感知、分析判斷能力,有人機(jī)交互能力、對(duì)于3D世界的實(shí)時(shí)理解能力,以及精準(zhǔn)的操作能力?!?/p>

人形機(jī)器人的的任務(wù)泛化能力決定了它能走的多遠(yuǎn)。很多企業(yè)正在瞄準(zhǔn)這個(gè)方向發(fā)力。

智元機(jī)器人最近發(fā)布的具身智能機(jī)器人遠(yuǎn)征A1就是一款人形機(jī)器人,稚暉君稱(chēng):“智元機(jī)器人致力于將先進(jìn)的機(jī)器人和AI技術(shù)與人類(lèi)生活以及生產(chǎn)制造緊密結(jié)合,未來(lái)讓機(jī)器人成為人類(lèi)的得力助手。遠(yuǎn)征A1未來(lái)可以在各種復(fù)雜場(chǎng)景下自主完成移動(dòng)和操作任務(wù)?!?/p>

前述提到的創(chuàng)業(yè)公司月泉仿生的機(jī)器人已經(jīng)能夠做到和人手相似的靈巧性。公司自主研發(fā)的類(lèi)人仿生智能靈巧手在外力干擾下可以通過(guò)主動(dòng)移動(dòng)、屈曲、翻轉(zhuǎn)等動(dòng)作調(diào)整,以保持手持物體不掉落?!俺嘶A(chǔ)的抓握、按壓等動(dòng)作外,還可以完成27種不同的手部復(fù)雜精細(xì)操作,比如使用筷子夾取細(xì)小物體、涂抹護(hù)膚品、攪拌咖啡、刷手機(jī)、解扣子等?!睋?jù)悉,月泉仿生智能靈巧手采用拉壓體驅(qū)動(dòng)技術(shù),擁有極高自由度。同時(shí)內(nèi)置了柔性傳感器,具有觸覺(jué)神經(jīng)反饋。

月泉仿生智能靈巧手,公司供圖

月泉仿生CTO趙迪告訴「甲子光年」,目前關(guān)節(jié)型的人形機(jī)器人普遍只能進(jìn)行抓取拿放,很難執(zhí)行解扣子這種更復(fù)雜的動(dòng)作。人形機(jī)器人要想真正服務(wù)人類(lèi),一個(gè)好用能干活的雙手是必需的,因此在底層原理方面創(chuàng)新突破并提出全新的構(gòu)型顯得尤為重要。

人形機(jī)器人運(yùn)動(dòng)方面,月泉仿生同樣圍繞著“仿生拉壓體機(jī)器人”這一自主創(chuàng)新理論展開(kāi)研究。趙迪提到,“正常情況下,一個(gè)關(guān)節(jié)最高可有6個(gè)自由度,但關(guān)節(jié)驅(qū)動(dòng)機(jī)器人為了追求控制精度鎖死了自由度,實(shí)際最多只有1~3個(gè)自由度,由此造成功耗水平也很高,是人體運(yùn)動(dòng)功耗水平的幾十倍乃至上百倍?!?/p>

據(jù)他介紹,月泉的仿生拉壓體機(jī)器人能夠克服傳統(tǒng)關(guān)節(jié)驅(qū)動(dòng)機(jī)器人的缺點(diǎn),使機(jī)器人具備與人相似的運(yùn)動(dòng)特性,可以在具備較高運(yùn)動(dòng)自由度的情況下,能夠兼顧穩(wěn)定性,并且能實(shí)現(xiàn)關(guān)節(jié)剛度的快速自適應(yīng)調(diào)節(jié)同時(shí)能使機(jī)器人實(shí)現(xiàn)與環(huán)境的安全交互,運(yùn)動(dòng)能耗指標(biāo)僅為人體的一到兩倍。同時(shí),由于采用了新的驅(qū)動(dòng)方式,月泉仿生的產(chǎn)品不再需要使用復(fù)雜昂貴的減速器,降低了成本。據(jù)了解,公司也自研了微電機(jī)和仿生材料,以匹配拉壓體驅(qū)動(dòng)方式的性能需要。

在機(jī)器人大會(huì)現(xiàn)場(chǎng),我們也看到非常多在展現(xiàn)各種技能的人形機(jī)器人。

追覓把今年3月新發(fā)布的人形機(jī)器人帶到了現(xiàn)場(chǎng),這是一款身高 178cm,體重 56kg的機(jī)器人,全身共 44個(gè)自由度,其中單腿還有完整的6個(gè)自由度,可以完成單腿站立。此外,機(jī)器人身上還配備了深度相機(jī),可以完成室內(nèi)3維環(huán)境的建模,同時(shí)還集成了AI大語(yǔ)言模型,可以進(jìn)行實(shí)時(shí)溝通對(duì)話(huà)。

表演咖啡拉花的追覓機(jī)器人,圖片來(lái)自追覓

追覓科技人形機(jī)器人負(fù)責(zé)人喻超告訴「甲子光年」:“人形機(jī)器人自主實(shí)現(xiàn)咖啡‘拉花’的難點(diǎn)在于,它需要在開(kāi)放空間里與人進(jìn)行交互,這意味著它所處的空間位置和運(yùn)動(dòng)軌跡會(huì)有許多不確定性,同時(shí)需要識(shí)別不同材質(zhì)及尺寸的工具。要解決這些問(wèn)題,就要搭載更多的智能模型、傳感器,并在機(jī)械結(jié)構(gòu)設(shè)計(jì)上做創(chuàng)新調(diào)整。”

機(jī)器人公司宇樹(shù)科技不僅帶來(lái)了已經(jīng)在行業(yè)場(chǎng)景中落地的四足機(jī)器人,也帶來(lái)最新發(fā)布的人形機(jī)器人H1。

甲子光年現(xiàn)場(chǎng)拍攝

這是一款能跑的全尺寸通用人形機(jī)器人,擁有全球近似規(guī)格最高動(dòng)力性能,并配置有360°全景深度感知,行走速度大于1.5m/s,潛在運(yùn)動(dòng)能力大于5m/s,整機(jī)重量約在47kg左右。相關(guān)人員告訴「甲子光年」,H1會(huì)在下半年正式投入生產(chǎn),價(jià)格在幾十萬(wàn)元人民幣以?xún)?nèi)。

即使被人從側(cè)面,后面踹一腳,H1都可以像人一樣,稍微踉蹌之后還能找到新的平衡,不會(huì)摔倒。一位機(jī)器人工程師告訴「甲子光年」:“實(shí)現(xiàn)這種功能并不是一件容易的事,背后用哪個(gè)數(shù)學(xué)函數(shù)大家都知道,但是能把它真正落地到產(chǎn)品中很難?!?/p>

大家對(duì)小米的好奇更多集中在最新發(fā)布的四足機(jī)器人身上,去年發(fā)布的人形機(jī)器人“鐵大”反而少有人在關(guān)注。據(jù)「甲子光年」了解,去年小米發(fā)布的人形機(jī)器人“鐵大”由追覓制造,后者本身也是小米生態(tài)鏈中的一員,在高度馬達(dá)等多個(gè)軟硬件方面有一些經(jīng)驗(yàn)積累。

甲子光年現(xiàn)場(chǎng)拍攝

達(dá)闥把人形雙足機(jī)器人“七仙女”小紫帶到了現(xiàn)場(chǎng),這款機(jī)器人身高165cm,體重65kg,全身采用了輕質(zhì)高強(qiáng)度的碳纖維復(fù)合材料,擁有60多個(gè)智能柔性關(guān)節(jié),由達(dá)闥全棧自研,搭載了海睿云端大腦操作系統(tǒng),集成了機(jī)器人多模態(tài)人工智能大模型RobotGPT?,F(xiàn)場(chǎng)還有一個(gè)人形機(jī)器人穿著球衣在表演定點(diǎn)投籃。達(dá)闥創(chuàng)始人兼CEO黃曉慶稱(chēng),“七仙女”將在2024年正式發(fā)布,2025年規(guī)模量產(chǎn)。

來(lái)自浙江大學(xué)控制學(xué)院機(jī)器人團(tuán)隊(duì)的同學(xué)也帶著“悟空-4”人形機(jī)器人來(lái)到了會(huì)上。據(jù)了解,“悟空-4”可適應(yīng)室外路面、草叢、泥濘路面等多種地形,最快運(yùn)動(dòng)速度可以達(dá)到6公里/小時(shí),還能跳高0.5米,還可以可上下25度斜坡和10厘米臺(tái)階。在路面打滑和外部推力干擾等未知擾動(dòng)下,可快速恢復(fù)平衡并保持穩(wěn)定行走。

浙江大學(xué)供圖

“悟空-4”通過(guò)融合腿足運(yùn)動(dòng)技術(shù)與環(huán)境感知技術(shù),實(shí)現(xiàn)了機(jī)器人的三維環(huán)境地圖構(gòu)建和自主動(dòng)態(tài)導(dǎo)航。該項(xiàng)目導(dǎo)師是朱秋國(guó)和熊蓉,都是機(jī)器人領(lǐng)域的專(zhuān)家,長(zhǎng)期從事腿足機(jī)器人、機(jī)器人智能感知控制、群體協(xié)作控制等研究,有深厚的理論與技術(shù)基礎(chǔ)。

清華大學(xué)交叉信息研究院和上海期智研究院所孵化的創(chuàng)業(yè)公司星動(dòng)紀(jì)元也帶著人形機(jī)器人產(chǎn)品來(lái)到了現(xiàn)場(chǎng)。

這次,星動(dòng)紀(jì)元的兩款產(chǎn)品小星和小星MAX都進(jìn)行了現(xiàn)場(chǎng)演示。小星在水泥地上、樹(shù)林里、草地里、石子路上都能快速行走,且有一定的穩(wěn)定性。

甲子光年現(xiàn)場(chǎng)拍攝

這兩款機(jī)器人產(chǎn)品背后,是公司自主研發(fā)的一系列軟硬件技術(shù):基于本體感知驅(qū)動(dòng)器的人形機(jī)器人本體;使用自研高扭矩密度模塊化關(guān)節(jié)以及一體化結(jié)構(gòu)設(shè)計(jì);以高強(qiáng)度合金、碳纖維和工程塑料等先進(jìn)材料,保留美觀外形,提高了結(jié)構(gòu)的強(qiáng)度和穩(wěn)定性;布局大語(yǔ)言模型,配以先進(jìn)的力控算法,具備高動(dòng)態(tài)性能的同時(shí)能更好地理解人類(lèi)。

從投資人追捧、頭部科技公司入局,到創(chuàng)業(yè)公司和高校的創(chuàng)新研究,眼下,人形機(jī)器人正在多個(gè)方向齊頭并進(jìn),迎來(lái)新的發(fā)展階段。

2.給人形機(jī)器人裝上大腦

大模型是推動(dòng)人形機(jī)器人走向熱潮的另一重關(guān)鍵技術(shù)變量。

OpenAI靠一己之力讓人類(lèi)邁進(jìn)了通用人工智能的大門(mén)前。大模型的觸角正在進(jìn)入各行各業(yè),與機(jī)器人結(jié)合之后,人類(lèi)開(kāi)啟了對(duì)通用機(jī)器人可能性的新想象:只能聊天對(duì)話(huà)太局限了,能不能通過(guò)指令,自己拆解任務(wù)并執(zhí)行到底?

云啟資本合伙人陳昱認(rèn)為,大模型本質(zhì)是軟件能力,在數(shù)字世界中,與現(xiàn)實(shí)世界連接最好的載體實(shí)際上是硬件載體?!澳壳?,我們更看重如何將大模型與機(jī)器人硬件結(jié)合,實(shí)現(xiàn)通用機(jī)器人的形態(tài)?!痹谒磥?lái),具身智能讓通用機(jī)器人已經(jīng)看到了一個(gè)可能的路徑,資本就是去給行業(yè)添一把柴火,經(jīng)過(guò)五年到十年的大規(guī)模的投入,讓它燒的更旺,最終實(shí)現(xiàn)通用機(jī)器人的商用化。

陳昱提到,目前機(jī)器人側(cè)研發(fā)關(guān)注的重點(diǎn)與以往不同:不再僅限于完成某一類(lèi)特定工作,而是進(jìn)一步完成多類(lèi)型任務(wù)。比如過(guò)去,配送機(jī)器人負(fù)責(zé)配送、建筑機(jī)器人智能刷墻。但在通用智能化的大背景下,未來(lái)將有可能實(shí)現(xiàn)機(jī)器人靈活用工,比如工廠環(huán)境中的機(jī)器人既能擰螺絲、又能?chē)娖?、還能完成零件組裝。

目前,不管是“具身智能”還是“通用人工智能”都是市場(chǎng)對(duì)2023年的人形機(jī)器人的新期待——通用人工智能對(duì)物理世界的價(jià)值需要有具身的實(shí)體來(lái)承載,并和真實(shí)的物理世界進(jìn)行交互,才能更大范圍的影響人類(lèi)。

線(xiàn)性資本投資總監(jiān)辛未認(rèn)為,大模型打開(kāi)了通用機(jī)器人的可實(shí)現(xiàn)性。辛未提到,機(jī)器人的通用化,需要解決幾個(gè)技術(shù)的問(wèn)題:上層需要對(duì)任務(wù)做理解、定義、規(guī)劃、拆分;中間需要能夠強(qiáng)泛化的執(zhí)行層來(lái)滿(mǎn)足不同場(chǎng)景的任務(wù)執(zhí)行;底層是相對(duì)成熟的機(jī)器人控制,再搭配上合適的硬件本體?!叭齻€(gè)層級(jí)中,在大模型出來(lái)之前,我們認(rèn)為頂層是最難實(shí)現(xiàn)的,而大模型的能力完全匹配了這一層的要求,使通用機(jī)器人具有變?yōu)楝F(xiàn)實(shí)的可能?!?/p>

很多創(chuàng)業(yè)公司看中的也是技術(shù)驅(qū)動(dòng)下,人形機(jī)器人的新能力可能會(huì)打開(kāi)全新的需求,更靠近落地。

宇樹(shù)科技創(chuàng)始人王興興提到,在幾年前,市場(chǎng)不看好人形機(jī)器人最關(guān)鍵的原因是,人類(lèi)的控制技術(shù)沒(méi)辦法駕馭人形機(jī)器人這么復(fù)雜的機(jī)器人形態(tài)。如今,在大模型的技術(shù)發(fā)展下,AI的發(fā)展已經(jīng)遠(yuǎn)超機(jī)器人需要的技術(shù)。“現(xiàn)在做人形機(jī)器人,借鑒現(xiàn)有的大模型技術(shù),做一個(gè)小模型甚至中等模型就能用了,這讓通用人形機(jī)器人技術(shù)層面邁過(guò)了一個(gè)鴻溝,未來(lái)幾年,只要突破工程方面的問(wèn)題,就可以讓人形機(jī)器人可以發(fā)揮很大的生產(chǎn)價(jià)值,帶來(lái)顛覆性的落地應(yīng)用。

正在研究雙足機(jī)器人的智能機(jī)器人公司逐際動(dòng)力創(chuàng)始人張巍認(rèn)為,人形機(jī)器人帶來(lái)的機(jī)器人通用機(jī)會(huì)在于,既可以解決目前專(zhuān)業(yè)機(jī)器無(wú)法處理的問(wèn)題,同時(shí)需要具備至少2-3個(gè)不同工種工人的能力,比如既能搬箱子,還可以?huà)?、進(jìn)行質(zhì)量檢測(cè)等,它需要是一個(gè)通用的物理運(yùn)動(dòng)平臺(tái)。

相比國(guó)內(nèi),國(guó)外的進(jìn)展更快一步,已經(jīng)把大模型的能力從語(yǔ)言穿透到執(zhí)行層。

今年7月,李飛飛團(tuán)隊(duì)在網(wǎng)上公開(kāi)了一個(gè)新的具身智能研究項(xiàng)目:接入大模型的機(jī)器人可以根據(jù)人類(lèi)發(fā)出的語(yǔ)言指令,自己進(jìn)行拉抽屜、擰瓶蓋、稱(chēng)重蘋(píng)果等動(dòng)作。

7月28日,谷歌DeepMind最推出的機(jī)器人模型Robotics Transformer 2(RT-2)也是這一方向研究的延伸。RT-2是一個(gè)全新的視覺(jué)-語(yǔ)言-動(dòng)作(VLA)模型,可以從網(wǎng)絡(luò)和機(jī)器人數(shù)據(jù)中學(xué)習(xí),并將這些知識(shí)轉(zhuǎn)化為機(jī)器人控制的通用指令。RT-2表現(xiàn)出了更好的泛化能力——理解范圍超出它所接觸到的機(jī)器人數(shù)據(jù)的語(yǔ)義和視覺(jué)范疇,且能解釋新指令并通過(guò)執(zhí)行基本推理來(lái)響應(yīng)用戶(hù)命令。

Google DeepMind的論文中介紹了Robotics Transformer 2(RT-2),一個(gè)全新的視覺(jué)-語(yǔ)言-動(dòng)作(VLA)模型,它從網(wǎng)絡(luò)和機(jī)器人數(shù)據(jù)中學(xué)習(xí),并將這些知識(shí)轉(zhuǎn)化為機(jī)器人控制的通用指令,同時(shí)保留了web-scale能力。

這些研究都為人類(lèi)邁向通用機(jī)器人奠定了關(guān)鍵一步。國(guó)內(nèi),來(lái)自清華的團(tuán)隊(duì)也一直進(jìn)行這一領(lǐng)域的研究。2000年圖靈獎(jiǎng)獲得者、中國(guó)科學(xué)院院士、清華大學(xué)交叉信息研究院院長(zhǎng)姚期智在論壇分享中提到,這種融合了大模型能力的新一代具身智能體需要具備三個(gè)特征:

如果具身智能為核心的通用機(jī)器人是未來(lái)方向,這個(gè)形態(tài)為什么一定是人形機(jī)器人?

誠(chéng)然,通用機(jī)器人不一定等于人形機(jī)器人,但目前,很多機(jī)器人從業(yè)者都提到,人形機(jī)器人是公認(rèn)的最好的通用機(jī)器人形態(tài)。

姚期智在分享中提到,目前,最好的通用機(jī)器人形態(tài)就是人形機(jī)器人,一方面人形機(jī)器人更能適應(yīng)各種環(huán)境,另一方面,當(dāng)前人類(lèi)社會(huì)環(huán)境中的種種設(shè)計(jì)都是為人類(lèi)量身定做,比如樓梯結(jié)構(gòu)、門(mén)把手高度、杯子形狀等,都是為人類(lèi)形象所定制。所以,如果要打造一個(gè)有泛應(yīng)用能力的通用機(jī)器人,人形是目前最好最適合的形態(tài)。

真格基金合伙人劉元告訴「甲子光年」,他認(rèn)為,人形機(jī)器人的產(chǎn)品定義和需求是有基礎(chǔ)的,它在某種程度上與人類(lèi)數(shù)百年前對(duì)機(jī)器人的期待就有些相似??v觀歷史中各類(lèi)技術(shù)的發(fā)展,很多新的產(chǎn)品都是對(duì)幾百年前人類(lèi)科幻作品中對(duì)未來(lái)生活的需求和解決方案的一種遙遠(yuǎn)回響。“幾百年前,人類(lèi)就想讓機(jī)器人幫做家務(wù)。之后就有了洗衣機(jī)、微波爐、掃地機(jī)器人。可以說(shuō),科幻完成了人類(lèi)對(duì)于需求的一個(gè)產(chǎn)品定義?!?/p>

但他也提到,這個(gè)階段很多公司一擁而上做人形機(jī)器人也有很大的跟風(fēng)成分。

3.大模型解決不了的問(wèn)題還有很多

理想豐滿(mǎn)的另一面是現(xiàn)實(shí)的骨感。對(duì)于正加速布局人形機(jī)器人賽道的科技公司而言,在把握當(dāng)前機(jī)會(huì)的同時(shí)還要考慮更多現(xiàn)實(shí)的技術(shù)難題和商業(yè)化挑戰(zhàn)。

技術(shù)層面,正如谷歌、李飛飛等團(tuán)隊(duì)正在研究的一樣,通用機(jī)器人領(lǐng)域也需要類(lèi)似GPT-4這樣的大模型,能夠真正一步到位,把多模式能力融合在一起,真正統(tǒng)一具身智能的發(fā)展。

但這并非易事,明勢(shì)資本合伙人夏令告訴「甲子光年」,目前論文和一些demo展示的機(jī)器人與大語(yǔ)言模型結(jié)合偏重交互問(wèn)題,但并不是解決交互問(wèn)題后,人形機(jī)器人就變成了通用機(jī)器人。“因?yàn)榧词够谌藱C(jī)交互完成高層次任務(wù)分解和規(guī)劃,機(jī)器人仍需要控制和執(zhí)行,包括在復(fù)雜地形的通用移動(dòng)能力和高精度操作能力。這些能力對(duì)機(jī)器人來(lái)說(shuō)仍有很大挑戰(zhàn)?!?/p>

夏令認(rèn)為,在控制執(zhí)行層面,大語(yǔ)言模型難以解決問(wèn)題?!罢驹谡麄€(gè)通用機(jī)器人的發(fā)展角度來(lái)看,大語(yǔ)言模型有貢獻(xiàn),但對(duì)底層控制和執(zhí)行的影響有限。目前學(xué)術(shù)界采用AI驅(qū)動(dòng)的方法,希望把強(qiáng)化學(xué)習(xí)的方式做底層的控制執(zhí)行,但這和大語(yǔ)言模型并沒(méi)有直接的關(guān)系。且強(qiáng)化學(xué)習(xí)的控制方法大部分還停留在學(xué)術(shù)研究階段?!?/p>

身在其中的企業(yè)也正在面對(duì)這些難題。宇樹(shù)科技創(chuàng)始人王興興提到,機(jī)器人領(lǐng)域會(huì)出現(xiàn)自身的大模型。在他看來(lái),大模型與機(jī)器人的融合是一個(gè)難點(diǎn),一些通用大模型并的文字邏輯化和處理能力不錯(cuò),但由于不是給通用人形機(jī)器人專(zhuān)門(mén)使用,所以這些大模型對(duì)環(huán)境認(rèn)知和感知能力基本是零。而不同于大語(yǔ)言模型的數(shù)據(jù)集可以直接從互聯(lián)網(wǎng)端獲取,機(jī)器人的數(shù)據(jù)都是動(dòng)態(tài)的數(shù)據(jù)集,需要在仿真環(huán)境中,獲得動(dòng)態(tài)模擬數(shù)據(jù),也依賴(lài)于和物理環(huán)境的基礎(chǔ)和交互,這些都需要一定的時(shí)間。

對(duì)于未來(lái)的技術(shù)進(jìn)展,王興興相對(duì)比較樂(lè)觀,目前英偉達(dá)已經(jīng)在推進(jìn)在仿真環(huán)境中的相關(guān)訓(xùn)練,從目前全球的熱度以及目前人工智能行業(yè)的進(jìn)展來(lái)看,不超過(guò)10年,會(huì)有顯著性進(jìn)步?!?/p>

也有人覺(jué)得不會(huì)很快。德國(guó)慕尼黑工業(yè)大學(xué)教授Alois C. Knoll提到,接下來(lái),機(jī)器人領(lǐng)域也需要慢慢的像大語(yǔ)言模型一樣,一步步的集成仿真、建模、編程、人工智能等多項(xiàng)能力,走出自身的智能泛化能力。“人形機(jī)器人是目前見(jiàn)到的最難最復(fù)雜的機(jī)器之一,這個(gè)過(guò)程需要時(shí)間,可能會(huì)比AGI慢,可能不會(huì)快速地見(jiàn)到巨變。”

另一個(gè)關(guān)鍵的挑戰(zhàn)在于軟硬件能力的協(xié)同進(jìn)化上。

與很多人都在推崇大模型給人形機(jī)器人帶來(lái)顛覆性的機(jī)會(huì)不同,波士頓動(dòng)力創(chuàng)始人Marc Raibert在演講中提到,未來(lái)的機(jī)器人技術(shù)發(fā)展過(guò)程中,硬件工程和軟件同等重要。“有些人認(rèn)為軟件可以克服硬件上所有的問(wèn)題和限制,我并不贊同這個(gè)觀點(diǎn)”。

在他看來(lái),只有最好的硬件設(shè)計(jì)師和軟件性設(shè)計(jì)師傾力合作,才能夠設(shè)計(jì)出世界上最好的機(jī)器人。以波士頓動(dòng)力的人形機(jī)器人為例,在Atlas的硬件工程方面,公司做了大量工作——包括液壓系統(tǒng)、多個(gè)專(zhuān)門(mén)的閥門(mén)、專(zhuān)用電池、負(fù)載等各個(gè)方面,把機(jī)器人的重量從170公斤縮小到90公斤,這個(gè)過(guò)程中,他們沒(méi)有在機(jī)器人的功能上有任何妥協(xié),反而提高了機(jī)器人的運(yùn)動(dòng)范圍力量和速度。

甲子光年現(xiàn)場(chǎng)拍攝

這是目前最現(xiàn)實(shí)的難點(diǎn)。尤其對(duì)于創(chuàng)業(yè)公司而言,平衡技術(shù)實(shí)現(xiàn)、性能和成本是關(guān)鍵能力。

星動(dòng)紀(jì)元CEO陳建宇稱(chēng),目前星動(dòng)紀(jì)元希望機(jī)器人能同時(shí)兼顧力量、速度、精度以及成本,但確實(shí)難以做到?!耙簤杭夹g(shù)能讓機(jī)器人的速度和力量都很強(qiáng),但成本太貴;電驅(qū)動(dòng)技術(shù)取決于如果用高減速比的諧波技術(shù),但一旦精度比較高,承載也不錯(cuò),靈巧性又會(huì)降低;而靈巧度上去了,成本比較低,但卻要犧牲機(jī)器人的載荷和精度?,F(xiàn)在很難兼顧所有情況,只能針對(duì)不同的應(yīng)用場(chǎng)景,進(jìn)行各要素的平衡?!?/p>

此外,在安全性上,大語(yǔ)言模型胡說(shuō)八道可能造成的影響不大,但一旦一臺(tái)搭載大模型的機(jī)器人進(jìn)入生活,就需要保證準(zhǔn)確度和安全性,這些都是技術(shù)需要改進(jìn)的方向。

這些問(wèn)題都需要人形機(jī)器人公司需在場(chǎng)景中不斷試錯(cuò)才能找到解題思路。

線(xiàn)性資本投資總監(jiān)辛未告訴「甲子光年」:人形機(jī)器人目前可展示的 demo 都相對(duì)初級(jí),無(wú)論是移動(dòng)還是操作,在場(chǎng)景端真正用起來(lái)需要算法和硬件有強(qiáng)泛化性,這是其商業(yè)化的基礎(chǔ),目前人形還有科學(xué)側(cè)的問(wèn)題沒(méi)有解決?!爱?dāng)然,我們既不能高估技術(shù)的短期效應(yīng),也不能忽視技術(shù)的長(zhǎng)期進(jìn)步,通用機(jī)器人已經(jīng)變成大火的領(lǐng)域,無(wú)論是學(xué)術(shù)側(cè)還是工業(yè)側(cè),更多的力量和資源涌入,我相信能在一定程度落地的商業(yè)化產(chǎn)品不遠(yuǎn)了?!?/p>

明勢(shì)資本合伙人夏令認(rèn)為,對(duì)于今天想去做通用機(jī)器人的創(chuàng)業(yè)公司而言,類(lèi)比自動(dòng)駕駛的發(fā)展,找到可商業(yè)化閉環(huán)和可數(shù)據(jù)閉環(huán)的L2尤其重要。因?yàn)樗哂姓鎸?shí)的商業(yè)化價(jià)值,同時(shí)底層技術(shù)能夠在商業(yè)化價(jià)值實(shí)現(xiàn)的基礎(chǔ)上,實(shí)現(xiàn)數(shù)據(jù)飛輪,支持繼續(xù)向L4的方向去發(fā)展?!叭绻阒挥蠰2,沒(méi)有去做L4的技術(shù)架構(gòu)、野心及能力也是不行的。所以就是要心懷著一個(gè)L4偉大的夢(mèng)想,同時(shí)要腳踏實(shí)地找到一個(gè)可商業(yè)化的L2。”

技術(shù)、場(chǎng)景、成本、安全,機(jī)會(huì)和挑戰(zhàn)正在同時(shí)到來(lái),人形機(jī)器人正邁出了通往未來(lái)的關(guān)鍵一步。

(封面圖來(lái)源:百度文心一格)

END.

關(guān)鍵詞:

專(zhuān)題新聞
  • 中國(guó)醫(yī)藥(600056)8月31日主力資金凈賣(mài)出1079.85萬(wàn)元
  • 2023長(zhǎng)沙少年宮培訓(xùn)課程有哪些?
  • 我欠了網(wǎng)貸和銀行很多錢(qián)怎么辦-
  • 長(zhǎng)葛市:跨省通辦 暖心惠民
  • 今日棉花糖superx9怎么樣(棉花糖X9和棉花糖Z7哪個(gè)好)
  • 首屆“蒙陜甘寧晉”五省區(qū)農(nóng)牧民排球邀請(qǐng)賽開(kāi)幕
最近更新

京ICP備2021034106號(hào)-51

Copyright © 2011-2020  亞洲資本網(wǎng)   All Rights Reserved. 聯(lián)系網(wǎng)站:55 16 53 8 @qq.com