研究人員尋找新的深度來訓練無人機導航
in 行業(yè)新聞 by cheng
這段人體模型挑戰(zhàn)視頻,由弗吉尼亞州邁爾亨德森堡聯合基地的3d美國步兵團(舊衛(wèi)隊)錄制。谷歌的研究人員在人體模型挑戰(zhàn)的視頻上訓練了一種算法,以從單個相機源確定深度。導航是一個篩選過程。就像昆蟲的復眼識別出它可以飛行的空間是什么和不是什么一樣,機器人上的傳感器不僅可以導航前方的路徑,還可以實時繪制出要避開的所有障礙物。今年發(fā)表的兩項研究,概述了如何訓練機器人在充滿障礙的空間之間導航。具體來說,這些是關于在人群中移動和在森林中移動的研究?!稛o人駕駛飛行器在未知雜亂環(huán)境中的自主導航》著眼于不顧樹木在森林中飛行。CINESTAV、墨西哥國家理工學院研究與高級研究中心和英特爾實驗室的研究人員創(chuàng)造了一種在陌生物體豐富的空間中快速飛行的方法。該框架使用深度傳感器的測量值來繪制距離上的視差。然后,第二種方法生成穿過該空間的路徑,同時考慮到傳感器看不到的限制。通過測量物體和繪制到設定目標的路徑,框架的第三部分生成實際的移動計劃。除了在模擬中進行測試外,研究人員還將他們的框架應用于一個經歷了一系列現實挑戰(zhàn)的機器人。其中包括一個迷宮、一個工業(yè)倉庫、一個有人在里面工作的實驗室和一片森林。該地圖提供了寶貴的信息,不僅可以在不依賴GPS的情況下穿過空間,還可以逃離死胡同。作者寫道:“在一般雜亂的環(huán)境中,逃離‘口袋’或走出死胡同的能力是完成導航任務的基礎?!??!俺吮苊饩植颗鲎餐猓@還需要維護和保持探索區(qū)域的最新地圖,以及處理未探索區(qū)域的策略?;谶@張地圖,機器人應該能夠生成從當前位置到目標的運動計劃。”雖然一個特定的實驗室可能擠滿了愿意為機器人測試提供背景信息的科學家,但很難找到人們在訓練導航算法時原地踏步的深度。在社交媒體上傳播的病毒式電影挑戰(zhàn)《人體模特挑戰(zhàn)》中參賽作品,讓人們呆在原地,而拍攝挑戰(zhàn)的人則在他們周圍穿行。根據研究數據,人體模型挑戰(zhàn)賽原來是一座金礦。谷歌研究團隊發(fā)表的《通過觀察冰凍的人來學習移動的人的深度》使用了大量的人體模型挑戰(zhàn)視頻來訓練算法,在沒有特殊深度傳感器的情況下從靜止視頻中推斷深度。作者寫道:“在這篇論文中,我們采用了一種數據驅動的方法,并從一個新的數據來源中學習了人類的深度先驗:數千個人們模仿人體模型的互聯網視頻,即在手持相機巡視現場時,以不同的自然姿勢冷凍。”?!耙驗槿耸庆o止的,所以可以使用多視圖立體重建來生成訓練數據?!毖芯咳藛T聲稱,他們的方法源于對人體模型挑戰(zhàn)數據集的訓練,比現有的試圖從單個相機推斷深度的方法提供了更好、更準確的深度預測。至少與具體方法同樣相關的是,從2000個上傳的個人視頻中挑選出一個數據集,該數據集可以訓練算法來了解相機如何在空間中圍繞人移動?!堵槭±砉ぜ夹g評論》的Karen Hao在談到這一特定數據集時寫道:“研究人員還發(fā)布了他們的數據集,以支持未來的研究,這意味著數千名參加人體模型挑戰(zhàn)賽的人將在不知不覺中繼續(xù)為計算機視覺和機器人研究的進步做出貢獻?!薄!半m然這對一些人來說可能是一個令人不安的驚喜,但這是人工智能研究的規(guī)則,而不是例外?!痹趶拇罅靠捎玫拿嫦蚬姷募糨嬛刑崛〉囊曨l集上訓練導航算法的潛力是巨大的,尤其是如果它產生可以在簡單的商用機器上運行的程序。深度傳感器可能是軍用機器人導航的理想選擇,但在現有攝像頭上操作的潛力使更廣泛的機器人更容易在人群或樹林中飛行。將上傳用于短暫模因的私人數據集顛覆到機器人導航中的倫理影響需要考慮,尤其是當科技公司的工作人員已經對旨在和平、民用的研究與適應軍事目的之間的關系提出質疑時。也就是說,消耗公共領域的視頻或五角大樓專門擁有的視頻可以為承包商提供一種方式,他們渴望將世界上的此類研究轉化為軍事導航工具。記錄戰(zhàn)場信息可能很困難,但在戰(zhàn)爭游戲和軍事演習的視頻上訓練數據集可能是一個探索不足的領域,這對軍方未來幾十年想要部署的自主機器人有潛在的好處。