中文 | English

新聞專欄 > 產業動態
陸發展人型機器人 滬學者點出:大模型數據上有三痛點

 聯合報/ 特派記者陳宥菘

第十屆中國上海國際技術進出口交易會(上交會)近日登場,人型機器人成為展會焦點。上海機器人產業技術研究院副院長周梅傑在配套論壇活動上指出,大陸在人型機器人的大模型數據方面有三個痛點,核心問題就是缺乏大規模標準化資料集。但他透露,該研究院正和上海交通大學、同濟大學、復旦大學等就一整套資料集方案進行開發研究,預計在八月份對外發布。

上交會的配套活動之一,第五屆中國國際大模型與智慧機器人創新發展大會14日下午登場。周梅傑在會上發表主旨演講時點出,大陸當前發展人型機器人,在大模型包括數據方面具有三個痛點難點:

第一,國外一些巨頭像Google紛紛佈局人型機器人數據集,而且初見成效。但大陸目前缺乏大規模標準化數據集,成為發展國產人型機器人大腦技術的瓶頸問題。第二,大規模標準化數據集面臨一些底層技術挑戰,包含數據品質監控難、人工標註代價大。第三,業界缺乏大規模人型機器人數據集標準規範,無法保證數據集的科學性、權威性、多樣性。

就如何彌補上述弱項,建立起大規模標準化資料集?周梅傑表示,該研究院正著手從大量數據採集、加工,到數據集構建、訓練和驗證等建立一套閉環完整流程,為促進人型機器人產業規模化發展提供數據支撐。

周梅傑會後接受本報採訪進一步補充,先是從採集大量數據,或者由大量機器人本體或整機的廠商貢獻數據。由於有些數據雜亂無章,所以要對數據進行治理,並對重要的數據進行標註,接著再針對機器人分成不同如家庭場景、工業場景、服務場景等進行數據模型訓練,並對數據進行增強。

他並表示,目前上海機器人研究院、上海市政府正在支持做這個事情,也和交大、同濟、復旦三家大學合力研究,預計8月份會對外發布一整套資料集方案,包括四個方面,資料庫、採集平台、訓練平台、驗證平台。

至於是否已實現自動化標註?周梅傑說,目前技術水平維持在半自動化標註,例如要讓機器人在一個場景裡拿一杯水,需要手工標註將水框出來。有些場景、有些東西可以實現自動化標註,但有更多的場景無法。具體如何實現自動化標註,還在嘗試各種方案。

另外,他還提到,從人形機器人市場規模來說,最大的市場空間還是家庭服務和陪伴場景,但技術難度也是最高的。而從價值量來說,關節是人形機器人的核心價值單位,大約占人形機器人本體成本的64%,甚至協作機器人包括外骨骼機器人、工業機器人價值最高的地方也都是關節。


資訊來源:聯合新聞網
日      期:2024/06/14
https://udn.com/news/story/7333/8031964


延伸閱讀
     ●  電路板展|東捷攜手富臨 秀先進載板製程解方

     ●  陸人形機器人高速增長 錢景好 估2026年規模將突破人民幣200億元

     ●  黃仁勳唱旺機器人 台廠喊衝 所羅門、廣運、達明大搶商機

     ●  AI 應用遍地開花 集邦:機器人商機爆發

     ●  豐田攜手波士頓動力 投入研發具備 AI 能力的機器人

     ●  中華電攜工研院 打造AI人機協作商模

更多...