中文 | English


新聞專欄 > 產業動態

陸發展人型機器人 滬學者點出:大模型數據上有三痛點

 聯合報/ 特派記者陳宥菘

第十屆中國上海國際技術進出口交易會(上交會)近日登場,人型機器人成為展會焦點。上海機器人產業技術研究院副院長周梅傑在配套論壇活動上指出,大陸在人型機器人的大模型數據方面有三個痛點,核心問題就是缺乏大規模標準化資料集。但他透露,該研究院正和上海交通大學、同濟大學、復旦大學等就一整套資料集方案進行開發研究,預計在八月份對外發布。

上交會的配套活動之一,第五屆中國國際大模型與智慧機器人創新發展大會14日下午登場。周梅傑在會上發表主旨演講時點出,大陸當前發展人型機器人,在大模型包括數據方面具有三個痛點難點:

第一,國外一些巨頭像Google紛紛佈局人型機器人數據集,而且初見成效。但大陸目前缺乏大規模標準化數據集,成為發展國產人型機器人大腦技術的瓶頸問題。第二,大規模標準化數據集面臨一些底層技術挑戰,包含數據品質監控難、人工標註代價大。第三,業界缺乏大規模人型機器人數據集標準規範,無法保證數據集的科學性、權威性、多樣性。

就如何彌補上述弱項,建立起大規模標準化資料集?周梅傑表示,該研究院正著手從大量數據採集、加工,到數據集構建、訓練和驗證等建立一套閉環完整流程,為促進人型機器人產業規模化發展提供數據支撐。

周梅傑會後接受本報採訪進一步補充,先是從採集大量數據,或者由大量機器人本體或整機的廠商貢獻數據。由於有些數據雜亂無章,所以要對數據進行治理,並對重要的數據進行標註,接著再針對機器人分成不同如家庭場景、工業場景、服務場景等進行數據模型訓練,並對數據進行增強。

他並表示,目前上海機器人研究院、上海市政府正在支持做這個事情,也和交大、同濟、復旦三家大學合力研究,預計8月份會對外發布一整套資料集方案,包括四個方面,資料庫、採集平台、訓練平台、驗證平台。

至於是否已實現自動化標註?周梅傑說,目前技術水平維持在半自動化標註,例如要讓機器人在一個場景裡拿一杯水,需要手工標註將水框出來。有些場景、有些東西可以實現自動化標註,但有更多的場景無法。具體如何實現自動化標註,還在嘗試各種方案。

另外,他還提到,從人形機器人市場規模來說,最大的市場空間還是家庭服務和陪伴場景,但技術難度也是最高的。而從價值量來說,關節是人形機器人的核心價值單位,大約占人形機器人本體成本的64%,甚至協作機器人包括外骨骼機器人、工業機器人價值最高的地方也都是關節。




取材自:聯合新聞網 (2024/6/14)
https://udn.com/news/story/7333/8031964



回應



發表回應

您的名字:


您的Email:


回應:


請輸入下方圖片內的文字(點擊圖片兩下可更換圖片,大小寫不拘)
圖形驗證碼