自主導航機械人 未來5年走入人類生活
今期請來商湯科技聯合創始人、執行董事王曉剛,講解集團剛與大曉機器人推出的產品。
近年機械人備受矚目,可以跳舞、參加運動會等,但是人形機械人還是比較少,而且操作不佳,因為還有很多問題需要突破,大曉機器人以機械狗為出發點,並且將慢慢演進變成人形,進入人類日常生活。
自從ChatGPT 3.5於2022年面世以來,引爆全球人工智能(AI)熱潮,並且滲透至人類的日常生活之中,包括機械人。
機械人由來已久,不過一直並非以人形出現,可能只是一部不同形狀的機器。
本週五(12月19日),商湯科技旗下的大曉機器人舉行發布會,推出行業首創的ACE具身研發範式、首個向全行業開源且實現商業應用的開悟世界模型3.0(Kairos 3.0)、讓具身本體擁有自主空間智能的具身超級大腦模組A1。
突破空間限制
商湯科技聯合創始人、執行董事王曉剛出任大曉機器人董事長,他說:「這款機械狗附有一個導航盒子,盒子裏面有各種傳感器、通訊的模塊,即使身處室外,它亦擁有自主導航的能力。」
機械狗其實並不是新鮮事物,很多科技公司都曾經展示相關的產品,但是大部分都沒有自主導航的能力。
至今的機械狗,絕大部分只能夠在特定的空間使用,因為始終需要人類進行操縱。
一直以來,要讓機械狗執行任務,人類先要使用掃描器,掃描周遭環境,然後建構高精度的地圖,並且在固定的路線上設定一些定位。
「機械狗在固定的定位上,進行拍攝或者巡邏;如果需要改變路線,就要重新建立高精度地圖,所以使用的範圍非常有限。」
大曉機器人推出的機械狗,擁有自主導航的能力,人們在一般通用的電子地圖上,例如高德、百度地圖,點出任何的位置,它都可以自己去。
機械狗擁有較大的視覺,它知道應該走哪條路,過馬路的時候懂得看紅綠燈。
大曉機器人這次發布全球首創環境捕捉引擎技術方式(Ambient Capture Engine, ACE)技術範式,構建以視覺為基礎的「環境式採集+世界模型+具身基模型」的全鏈路技術體系。
大曉機器人通過第一視角數據+第三視角的採集方式,構建高效、高質的數據採集模式,破解傳統真機採集難以支撐大規模訓練的難點,讓數據可以共享,形成一個超強的大腦。
「ACE的研究以人為中心,通過各種穿戴式的設備,還有第三視覺的傳感器,去捕捉人類的行為和活動,然後把這些活動傳送到機械人身上,讓機械人能完成更加複雜的任務。」
大曉機器人以內地首個開源,並且已經實現商業應用的開悟世界模型3.0和具身智能模型為技術基礎,解決具身智能行業,目前面臨的「數據荒、常識差、泛化難、通用性不足」等核心挑戰。
大曉機器人同時推出具身超級大腦模組A1,加速具身智能在多元場景的規模化、商業化落地。

兩年左右有望變現
商湯科技的網絡發展分為三個階段,第一個階段是多模態的融合理解,換句話說,就是讓機械人真切了解這個世界的樣子。
「機械人需要接觸物體,所以需要了解立體空間中,人類和物件的軌跡,輸入的資料並不單是圖像及視頻,還包括鏡頭拍攝的影像。」
有些機械人的手腕上附有鏡頭,透過這些鏡頭拍攝的情景,讓機械人知道自己的手腕處於怎樣的位置。
當它的手腕不斷郁動,再將相關圖片及視頻合成,就可以知道機械人的活動情況,同時理解這個機械人與物理環境之間的規律,這就是第二個階段。
在機械人跟環境交互,所產生的數據中,人們可以進行任何的編輯,例如將環境中的桌子和水樽,換成其它的樣子。
第三個階段是預測,基於現在的圖像和鏡頭拍到的情況,預測機械臂應該以怎樣的軌跡進行動作。
商湯科技的軟件,配合大曉機器人的硬件,令機械狗能夠因應地圖上任何目標,自行走到目的地,執行遠端指令。
「當看見穿黑色衣服的人需要幫助,可以指示機械狗過去提供協助;巡邏期間發現有違例泊車,機械狗可以把車牌拍下來。」
在旅遊景點,機械狗可以作為遊客的導遊,解說景點的資訊,同時也可以為旅客拍照。
截至目前為止,一般人所接觸到的機械人,大多是提供情緒價值,例如進行表演,以及提供導覽。
「商湯科技之前也有推出用作表演的機械人,以及四足機械人,已有變現的能力;至於具備空間自主能力的機械狗,我相信隨2026年推出大規模的商業推廣,在商業服務的場景落地,預期未來兩年左右可以變現。」
商湯科技先後服務超過3,000個客戶,首階段將找出重點客戶,進行機械狗的試點運作。王曉剛期望,2026年機械狗的出貨量,可以達到1,000隻以上。
機械狗的應用場景有很多,例如在工廠裏搬運貨物,在零售層面進行貨物的分件及打包。
當這種具有自主導航能力的機械狗,大幅應用於各種場景,搜集更多數據進行優化,日後可以拓展至人形機械人。

市場規模數十萬億元
「機械人進入家庭場景,這都是人們特別期盼的,相信要五年或以上的時間,屆時機械人需要完成更加複雜的工作,所以技術需要繼續提升。」
在家庭場景,機械人需要照顧長者及兒童,甚至還有寵物,這樣它需要擁有安全意識,遇到緊急情況需要懂得避讓。
在自動駕駛場景,有所謂的「主動安全」,系統設有雷達,或者是電腦視覺,當偵測到一定距離的時候,會主動避免碰撞。
至於機械人,它與人類的距離會更加接近,這時候雷達就不行,可能需要給機械人加一層皮膚,讓它能夠通過電場感覺距離,避免碰撞或傷害人類。
現時機械人在各種觸覺的感知能力,跟人類的差距還很大,需要克服很多困難。
「例如為長者倒一杯開水,機械人需要知道水溫是否合適,不能燙傷長者;為人們提供食物的時候,需要知道食物是否新鮮。這些需要額外的傳感器,為機械人提供不同的資訊。」
機械人還需要處理各種家務,例如收拾桌子,如果桌子上面有書,它要知道這本書原本在甚麼位置,所以需要有長期記憶。
直至現時為止,機械人還沒有一個比較強的大腦,讓它完成各種非常複雜的任務,所以未能普及。
以目前的情況而言,消費級的機械狗,價格介乎數萬元至數十萬元,由於還沒有達到規模化量產的階段,整個供應鏈還不成熟,所以價格較為高昂。
「現時一些規模較大的商業應用場景,機械狗的平均價格約20萬至50萬元之間,我們相信通過規模化、硬件的優化,價格可以下降至10萬元左右,甚至是更低的水平。」
截至目前為止,機械人進入人類日常生活的場景,事實上亦不多,所以市場上仍有很大的增長空間。
「在數量方面,機械人可以媲美手機,甚至比手機還要多;至於價值,機械人的單價可以與汽車相提並論。所以機械人這條賽道,市場規模可達數十萬億元。」王曉剛說。

強強聯手
大曉機器人是商湯科技培育的機械人硬體公司,但是商湯科技並不控股,公司仍然擁有非常獨立的自主性。
商湯科技過去投資了一批機械人上下游的公司,包括研發硬件,以及不同的技術。
「商湯科技比較擅長研發模型,尤其是機械人的大腦,亦即是軟體的產品;至於硬件方面,我們與生態的合作夥伴一起合作,共同設計和生產。」
在內地,從事硬件的廠商非常多,商湯科技主要選取合適的數間公司合作,進行聯合研發。


