同時定位與及地圖構建

同時定位與及地圖構建英文Simultaneous localization and mapping,SLAM)係計算幾何學同埋機械人學當中嘅一種運算問題,志在構造抑或係更新未知環境嘅地圖嗰陣、同時跟踪埋個智能體喺地圖入邊嘅位置。雖然呢個問題初初睇落似係雞先定蛋先問題,但對於某啲環境,都有返幾種演算法係喺可控時間內勉強搞得扂佢嘅。啲近似嘅解決方案流行嘅包括有粒子濾波器擴展卡曼濾波器協方差交點同埋GraphSLAM。SLAM算法使喺導航、機械人地圖構建當中,亦使喺虛擬實境抑或係擴張實境里程計當中。

2005年DARPA大挑戰賽冠軍STANLEY,上高運行有SLAM作為佢自動駕駛系統嘅一部分
SLAM機械人生成嘅地圖

SLAM算法係基於啲手頭上嘅資源量身做嘅,所以唔志在完美、衹志在操作啱搭性(operational compliance)。公佈有嘅方法得使喺自動駕駛汽車無人駕駛飛行器自主水下航行器行星漫遊車、新式家用機械人甚至人體內部探察啲領域之中。

數學描述 編輯

根據貝葉斯規則、特別係貝葉斯推論有:

 

裏頭啲字母表示:

證據 (譬如睇到路邊有隻鴨 )同埋佢嘅概率 
假說 (譬如位置到唨某個圩市 度)同埋嘅概率 先驗概率);
假說 啱嘅話睇到證據 條件概率 (到唨個圩市 會睇到路邊有隻鴨 嘅概率);
持有證據 嗰陣證實假說 係啱嘅條件概率 (睇到路邊有隻鴨 證實到唨個圩市 嘅概率)(後驗概率,posteriors)。

基於呢種貝葉斯框架,SLAM問題入便嘅定位部分可以表述爲畀有一系列嘅控制量 同埋傳感器觀察量 ,喺離散步 上,要得到智能機狀態(位置同姿態等等)嘅一個估計值 。所有啲數量好多時都係概率性嘅。係噉,就可以表示成[1]

 
 

其中

 :喺某笪埞睇到嘢嘅概率(代表傳感器模型);
 :喺先前一笪埞 得到命令 之後到新埞嘅概率(代表運動模型),又叫轉換函數
 :早先狀態 轉到噉時狀態 
 :觀察值概率嘅倒數,對應貝葉斯推論式嘅分母。

推廣到離散時間 ,考慮埋地圖 嘅構建嘅情況下,SLAM問題目標係計出:

 

透過呢種框架,可以根據一幅地圖同埋相應嘅轉換函數  嚟按順序更新啲位置嘅後驗概率:

 

同樣個地圖可以按順序進行更新:

 

似好多推斷問題(inference problems)噉,要得出考慮埋兩隻變數嘅嗰啲解以及一個局部最優解,可以透過用期望最大化算法嘅形式交替更新嗰兩個信念(beliefs)嚟做到。

演算法 編輯

用於比照接近前述方程式嘅統計學技術包括卡曼濾波器同埋粒子濾波器(即蒙地卡羅方法)。針對機械人嘅姿勢同埋地圖參數,啲技術可以估計返後驗概率函數。啲使協方差交叉嚟保守近似前述模型嘅方法可以避免得到依賴統計獨立性假設,來到減少大規模應用陣時嘅算法複雜性。[2]其他啲近似方法、之用到簡單有界區域表述畀唔確定性嘅,都有提高到計算效率。[3]

至於集合成員技巧英文Set estimation就主要基於區間約束傳播英文Interval propagation[4][5]啲技巧提供唨一個包埋機械人姿勢嘅集合同埋地圖近似值嘅集合。捆綁調整(又喊做「光束法平差」),廣泛來講又係最大後驗估計(MAP),係SLAM嘅另一種流行技巧使到圖像數據嘅,佢可以將姿勢同埋地標位置佮埋起身估計,可以提高地圖保真度,並且經已用於啲商業化嘅SLAM系統當中(譬如Google嘅ARCore,之替走唨佢哋之前整開嘅擴張實境項目「 Tango 」)。喺畀定傳感器數據嘅情況下,最大後驗估計個估計器會計出一個最可能解釋畀機械人姿勢與及地圖,而唔係嘗試去估計成個後驗概率。

新嘅SLAM算法仲係一個活躍嘅研究領域,[6] 而且經常係旨在處理類似下低提到嘅唔同要求同埋假設,啲針對唔同地圖、傳感器同埋模型嘅。好多SLAM系統都可以睇作係考慮埋呢啲唔同方面之後而經過揀選鬭出嘅結合體。

任務 編輯

繪圖 編輯

拓撲地圖係一種環境表示方法:比起創建幾何上精確嘅圖,反而志在捕獲個環境嘅連通性(即拓撲)。喺度量SLAM算法入便,經已使開拓撲SLAM方法嚟強制實現全局一致性。[7]

反之,柵格地圖使用離散單元數組(通常為正方形抑係六邊形)嚟表示一個拓撲世界,藉此推斷出邊啲單元格捱厏住。好多時就假定啲單元格喺統計上係獨立嘅,嚟幫助簡化計算。喺噉嘅假設下,若果喺位置 新地圖嘅單元格同觀測值  一致,個值 就設為1;若果唔係就設0。

藉由廣泛使用啲預早收集好嘅、高度詳細嘅地圖數據,入邊啲圖註詳細到包埋道路上各個白線段同埋路緣啲標記位置嘅,現代自動駕駛汽車上個製圖問題幾乎可以簡化到直程冇咁嚌。標有位置嘅視覺數據(例如Google嘅StreetView)亦都可以當作地圖嘅一部分。實質上,噉嘅系統直程捉SLAM問題簡化成一個愈發簡單嘅純定位任務(localisation only task),之可能衹需要到更新啲運行陣時出現喺地圖上嘅嗰啲喐緊嘅嘢(似汽車同人)。

感測 編輯

 
嚟自光達SLAM嘅累積註冊點雲。

SLAM使開幾種唔同類型嘅傳感器,而且各種傳感器類型嘅功能同埋極限一直係推動新算法產生嘅主要動力。[8]統計獨立性係應對度量偏差同埋測量噪聲嘅強制性要求。唔同類型嘅傳感器催生唨唔同嘅SLAM算法,相應算法啲假設又最啱返啲傳感器。極端情況下,激光深度傳感器得出嘅激光掃描結果抑或係視覺傳感器攞到嘅視覺特徵可以畀足區域內好多點嘅細節,令到有時毋需再進行SLAM推斷,因為啲點雲入便嘅形狀可以透過圖像配準嘅每個步驟輕鬆、明確噉對齊錔返。相反,觸覺傳感器非常之稀疏(sparse),因為僅衹得到十分之臨近個智能機啲點嘅信息,所以要到好強大嘅先驗模型嚟補償啲純觸覺嘅SLAM方案。大多數實際嘅SLAM任務介於嗰視覺、触覺兩種極限之間。另外,仲有依靠聽覺傳感器聽覺SLAM

傳感器模型可以大致噉分為基於地標嘅方法同埋基於原始數據嘅方法。地標係世界上啲可以唯一標識得嘅對象,個位置可以藉由傳感器估算出嚟,譬如wifi接入點抑或係無線電信標。原始數據方法唔假定啲地標可以識別得,而係幫 建模並直接攞嚟作為位置嘅函數。

光學傳感器可以係一維(單光束)抑或係二維(掃描)嘅激光測距儀、3D高解析度光達3D閃光光達、2D/3D聲納傳感器與及一/多台2D攝像頭[8]自2005年以嚟,由於喺移動設備中使用攝像頭係越嚟越普及[9],主要使用視覺(攝像頭)傳感器嘅VSLAM(可視SLAM)方案就得到唨深入研究。視覺同埋LIDAR傳感器啲信息豐富到可以喺好多情況下提取出啲地標。同時,SLAM嘅其他最新形式都包括有觸覺式SLAM[10] (僅衹透過本地觸摸感測)、雷達SLAM[11]、聲學SLAM[12]、同埋Wifi-SLAM(透過附近Wifi接入點嘅強度進行感測)[13]。近排有方法將SLAM佮埋用於多邊(譬如喺Real-time locating system,RTLS)抑或係多角度測量嘅準光學(quasi-optical)無線測距當中,以應對無線測量嘅唔穩定。一種用於行人室內定位系統嘅SLAM,衹使安裝喺鞋度嘅慣性測量單元作為主要傳感器,單純依賴啲行人識避開啲牆嚟自動繪出建築物嘅室內平面圖[14]

對於某啲戶外應用,鑑於高精度差分GPS傳感器嘅應用,SLAM嘅需求幾乎已經冇唨。從SLAM嘅角度嚟睇,考慮到啲似然值(likelihoods)之高,啲可以睇作係位置傳感器嘅裝置已經完全滿足SLAM嘅推斷任務。但係,GPS傳感器有時可能性能會下降抑係完全失效,特別係喺軍事衝突期間,啲都係某啲機械人應用十分關注到嘅場合。

運動學建模 編輯

 個式表示模型嘅運動學信息,通常包含有啲畀到機械人嘅動作命令嘅信息。機械人嘅運動學信息作為模型嘅一部分亦都包含喺模型裏便,嚟到改善喺固有噪聲同埋環境噪聲條件下嘅感知估計。個動態模型識平衡到嚟自各種傳感器、各種局部誤差模型嘅貢獻,並最終以一幅地圖嘅形式喺清晰、虛擬嘅描述結果當中整合嗮啲信息,之機械人嘅位置同埋前進方向就表現爲某啲機率雲。地圖構建係此類模型嘅最屘一個描繪過程,地圖本身就係噉樣嘅描繪結果抑或係個模型嘅抽象表述。

對於2D機械人,運動學信息一般由旋轉信息佮埋「前進」命令畀出,同時考慮埋啲電機噪聲而實現到。雖然互相獨立嘅噪聲喺角度同埋線性方向上形成嘅分佈並非高斯分佈,但經常藉由高斯分佈嚟做近似。另一種方法係忽略丟運動學信息,並且喺每個命令之後從機械人車輪度讀取啲里程計數據,之可以着睇作係一種傳感器信息而唔係運動學信息。

SLAM細分領域 編輯

聽覺SLAM 編輯

常見嘅SLAM問題經已擴展並應用到聲音領域,其中啲環境由聲源嘅三維位置表示。[15]呢種技術亦即係聽覺SLAM(Acoustic SLAM),佢個早期實現經已利用到到達方向(Direction-of-Arrival,DoA)嚟估計聲源位置,並且依靠聲音定位嘅原理嚟確定啲聲源嘅位置。觀察者,也即係機械人必須配備咪高風陣列先用得到聽覺SLAM,噉樣先正確噉估計得到啲DoA特徵。聽覺SLAM為聲音場景地圖構建嘅進一步研究奠定基礎,同時亦都可以透過語音喺人機交互中發揮到重要作用。為唨幫多個、間中會斷續嘅聲源嚟做地圖構建,聽覺SLAM系統利用隨機有限集理論(Random Finite Set theory)入便嘅基礎原理嚟處理聲音地標嘅嗰啲變化。[16]但係,聲音特徵嘅本身性質令到聽覺SLAM易受環境中混響、聲源靜默情況同埋噪聲問題嘅影響。

視聽SLAM 編輯

初初係為人機交互設計嘅視聽SLAM係一個框架,佢可以融合環境入便嘅聽覺形態同埋視覺形態嚟獲得地標特徵。[17]人類互動嘅特徵唔單止限於視覺形態,仲包括埋聽覺形態。因此,以人作為中心嘅機器同埋機械人嘅SLAM算法必須兼顧呢兩組功能。透過使用諸如人嘅姿勢之類嘅視覺特徵同埋諸如人嘅言語之類嘅聽覺特徵,視聽框架可以估計到並繪製出人類地標嘅位置,並融合嗰啲信念嚟整出一幅仲要頑健尐嘅環境地圖。對於移動機械人(例如無人機、服務機械人)當中嘅應用,使返低功率、輕便尐嘅設備(例如單目相機抑或微電子咪高風陣列)十分之有價值。視聽SLAM仲可以實現啲傳感器之間嘅互補功能,藉由音頻傳感器嘅全感測範圍同埋無障礙表示環境嘅特性可以補償返光學傳感器啲諸如視場逼窄、特徵遮擋、仲有輕量級光學傳感器常見嘅光學衰減(optical degradations)等問題。音頻傳感器對混響、聲源靜默同埋噪聲等等問題嘅易感性亦都可以透過融合返由視覺方式獲取嘅地標信念而得到相應嘅補償。對於創造啲佮人類語音同埋人類動作完全交互得嘅機械人同埋機器嚟講,環境入便聽覺同埋視覺感知途徑之間嘅互補能力非常之有價值。

協作SLAM 編輯

協作式SLAM可以組合嚟自多個機械人抑係用戶嘅圖像,嚟生成3D地圖。[18]

動態環境 編輯

非靜態環境(例如包含其他車輛抑係行人嘅環境)照舊有好多挑戰值得研究。[19][20]用DATMO嘅SLAM係一種模型,之可以用返戥跟蹤智能機本體類似嘅方式嚟跟蹤埋環境入邊啲移動對象。[21]

閉環問題 編輯

閉環問題係識別先前到達過嘅位置並相應噉更新信念嘅問題。呢個點解成爲一個問題係因為模型抑係算法嘅錯誤會令到系統分配到低先驗值畀個位置。典型嘅閉環方法使到第二種算法嚟計出某種類型嘅、傳感器測量嘅相似度,並喺檢測到匹配嗰陣,設置過啲位置嘅先驗值。呢個可以透過譬如話存儲同埋比較啲嚟自每個先前訪問過嘅位置個SIFT特徵嘅詞袋矢量嚟做到。

主動勘察 編輯

「主動SLAM」研究SLAM個綜合問題,即決定下一步移動邊度先可以最高效噉構建返幅地圖。呢種主動勘察喺觸覺SLAM之類啲稀疏傳感方案中特別要用到。主動SLAM經常係透過喺假設動作下逼近地圖嘅嚟做到。「多重智能機SLAM」仲將呢個問題擴展到多個機械人協調佮夥嚟進行最佳探索嘅情況。

仿生SLAM 編輯

喺神經科學中,海馬體似乎參與唨SLAM嘅運算,[22][23][24] 並促使位置細胞嘅形成,幫由生物啟發嘅SLAM系統(譬如RatSLAM)奠定唨基礎。

實現 編輯

各種SLAM算法都喺開源機械人作業系統(ROS)啲庫度實現到,經常佮埋點雲庫(對於3D地圖)抑或係OpenCV(對於視覺特徵)一齊用。

歷史 編輯

SLAM嘅其中一項開創性工作係RC Smith同埋P. Cheeseman喺1986年關於空間唔確定性嘅表示同埋估計嘅研究。[25][26]其他開拓性工作由休·杜蘭特·懷特( Hugh F. Durrant-Whyte)個研究小組喺1990年代初做出[27],個研究表明SLAM嘅解決方案衹存在於無窮數據極限當中。呢個發現令到啲人尋找喺計算上易處理並接近個解嘅算法。

塞巴斯蒂安·特倫( Sebastian Thrun)領導嘅自動駕駛車STANLEY同埋JUNIOR贏得唨DARPA大挑戰賽,又喺2000年代嘅DARPA城市挑戰賽入便獲得第二名。佢啲車上高搭載有SLAM系統,令到SLAM引起唨全世界嘅關注。而家可以喺消費級機械人吸塵器入便搵到大眾市場嘅SLAM實現。[28]

睇埋 編輯

參考 編輯

  1. Howie, Choset (2007). "Chap9-Bayesian-Mapping_howie" (PDF). Carnegie Mellon University - School of Computer Science.{{cite web}}: CS1 maint: url-status (link)
  2. Julier, S.; Uhlmann, J. (2001). Building a Million-Beacon Map. Proceedings of ISAM Conference on Intelligent Systems for Manufacturing. doi:10.1117/12.444158.
  3. Csorba, M.; Uhlmann, J. (1997). A Suboptimal Algorithm for Automatic Map Building. Proceedings of the 1997 American Control Conference. doi:10.1109/ACC.1997.611857.
  4. Jaulin, L. (2009). "A nonlinear set-membership approach for the localization and map building of an underwater robot using interval constraint propagation" (PDF). IEEE Transactions on Robotics. 25: 88–98. doi:10.1109/TRO.2008.2010358.
  5. Jaulin, L. (2011). "Range-only SLAM with occupancy maps; A set-membership approach" (PDF). IEEE Transactions on Robotics. 27 (5): 1004–1010. doi:10.1109/TRO.2011.2147110.
  6. Cadena, Cesar; Carlone, Luca; Carrillo, Henry; Latif, Yasir; Scaramuzza, Davide; Neira, Jose; Reid, Ian; Leonard, John J. (2016). "Past, Present, and Future of Simultaneous Localization and Mapping: Toward the Robust-Perception Age". IEEE Transactions on Robotics (美國英文). 32 (6): 1309–1332. arXiv:1606.05830. Bibcode:2016arXiv160605830C. doi:10.1109/tro.2016.2624754. ISSN 1552-3098.
  7. Cummins, Mark; Newman, Paul (June 2008). "FAB-MAP: Probabilistic localization and mapping in the space of appearance" (PDF). The International Journal of Robotics Research. 27 (6): 647–665. doi:10.1177/0278364908090961. 喺23 July 2014搵到.
  8. 8.0 8.1 Magnabosco, M.; Breckon, T.P. (February 2013). "Cross-Spectral Visual Simultaneous Localization And Mapping (SLAM) with Sensor Handover" (PDF). Robotics and Autonomous Systems. 63 (2): 195–208. doi:10.1016/j.robot.2012.09.023. 喺5 November 2013搵到.{{cite journal}}: CS1 maint: url-status (link)
  9. Karlsson, N.; 等 (Di Bernardo, E.; Ostrowski, J; Goncalves, L.; Pirjanian, P.; Munich, M.) (2005). The vSLAM Algorithm for Robust Localization and Mapping. Int. Conf. on Robotics and Automation (ICRA). doi:10.1109/ROBOT.2005.1570091.
  10. Fox, C.; Evans, M.; Pearson, M.; Prescott, T. (2012). Tactile SLAM with a biomimetic whiskered robot (PDF). Proc. IEEE Int. Conf. on Robotics and Automation (ICRA). 原著 (PDF)喺2018年11月23號歸檔. 喺2021年2月14號搵到.
  11. Marck, J.W.; Mohamoud, A.; v.d. Houwen, E.; van Heijster, R. (2013). Indoor radar SLAM A radar application for vision and GPS denied environments (PDF). Radar Conference (EuRAD), 2013 European.
  12. Evers, Christine, Alastair H. Moore, and Patrick A. Naylor. "Acoustic simultaneous localization and mapping (a-SLAM) of a moving microphone array and its surrounding speakers." 2016 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2016.
  13. Ferris, Brian, Dieter Fox, and Neil D. Lawrence. "Wifi-slam using gaussian process latent variable models 互聯網檔案館歸檔,歸檔日期2022年12月24號,.." IJCAI. Vol. 7. No. 1. 2007.
  14. Robertson, P.; Angermann, M.; Krach, B. (2009). Simultaneous Localization and Mapping for Pedestrians using only Foot-Mounted Inertial Sensors (PDF). Ubicomp 2009. Orlando, Florida, USA: ACM. doi:10.1145/1620545.1620560. 原著 (PDF)喺2010-08-16歸檔.
  15. Evers, Christine; Naylor, Patrick A. (September 2018). "Acoustic SLAM" (PDF). IEEE/ACM Transactions on Audio, Speech, and Language Processing. 26 (9): 1484–1498. doi:10.1109/TASLP.2018.2828321. ISSN 2329-9290.
  16. Mahler, R.P.S. (October 2003). "Multitarget bayes filtering via first-order multitarget moments". IEEE Transactions on Aerospace and Electronic Systems (英文). 39 (4): 1152–1178. Bibcode:2003ITAES..39.1152M. doi:10.1109/TAES.2003.1261119. ISSN 0018-9251.
  17. Chau, Aaron; Sekiguchi, Kouhei; Nugraha, Aditya Arie; Yoshii, Kazuyoshi; Funakoshi, Kotaro (October 2019). "Audio-Visual SLAM towards Human Tracking and Human-Robot Interaction in Indoor Environments". 2019 28th IEEE International Conference on Robot and Human Interactive Communication (RO-MAN). New Delhi, India: IEEE: 1–8. doi:10.1109/RO-MAN46459.2019.8956321. ISBN 978-1-7281-2622-7.
  18. Zou, Danping, and Ping Tan. "Coslam: Collaborative visual slam in dynamic environments." IEEE transactions on pattern analysis and machine intelligence 35.2 (2012): 354-366.
  19. Perera, Samunda; Pasqual, Ajith (2011). Bebis, George; Boyle, Richard; Parvin, Bahram; Koracin, Darko; Wang, Song; Kyungnam, Kim; Benes, Bedrich; Moreland, Kenneth; Borst, Christoph (編). "Towards Realtime Handheld MonoSLAM in Dynamic Environments". Advances in Visual Computing. Lecture Notes in Computer Science (英文). Springer Berlin Heidelberg. 6938: 313–324. doi:10.1007/978-3-642-24028-7_29. ISBN 9783642240287.
  20. Perera, Samunda; Barnes, Dr.Nick; Zelinsky, Dr.Alexander (2014), Ikeuchi, Katsushi (編), "Exploration: Simultaneous Localization and Mapping (SLAM)", Computer Vision: A Reference Guide (英文), Springer US: 268–275, doi:10.1007/978-0-387-31439-6_280, ISBN 9780387314396
  21. Wang, Chieh-Chih; Thorpe, Charles; Thrun, Sebastian; Hebert, Martial; Durrant-Whyte, Hugh (2007). "Simultaneous Localization, Mapping and Moving Object Tracking" (PDF). Int. J. Robot. Res. 26: 889–916. doi:10.1177/0278364907081229.
  22. Howard, MW; Fotedar, MS; Datey, AV; Hasselmo, ME (2005). "The temporal context model in spatial navigation and relational learning: toward a common explanation of medial temporal lobe function across domains". Psychological Review. 2005, Psychol Rev. 112(1):75-116. 112 (1): 75–116. doi:10.1037/0033-295X.112.1.75. PMC 1421376. PMID 15631589.
  23. Fox, C; Prescott, T (2010). "Hippocampus as Unitary Coherent Particle Filter" (PDF). The 2010 International Joint Conference on Neural Networks (IJCNN). 2010, International Joint Conference on Neural Networks. pp. 1–8. doi:10.1109/IJCNN.2010.5596681. ISBN 978-1-4244-6916-1.
  24. Milford, MJ; Wyeth, GF; Prasser, D. RatSLAM: a hippocampal model for simultaneous localization and mapping (PDF). Proceedings. ICRA'04. IEEE International Conference on. Vol. 1. IEEE, 2004. 原著 (PDF)喺2017年2月15號歸檔. 喺2021年2月14號搵到.
  25. Smith, R.C.; Self, M.; Cheeseman, P. (1986). "Estimating Uncertain Spatial Relationships in Robotics" (PDF). Proceedings of the Second Annual Conference on Uncertainty in Artificial Intelligence. UAI '86. University of Pennsylvania, Philadelphia, PA, USA: Elsevier. pp. 435–461. 原著 (PDF)喺2010-07-02歸檔.
  26. Smith, R.C.; Cheeseman, P. (1986). "On the Representation and Estimation of Spatial Uncertainty" (PDF). The International Journal of Robotics Research. 5 (4): 56–68. doi:10.1177/027836498600500404. 原著 (PDF)喺2020-09-28歸檔. 喺2008-04-08搵到.
  27. Leonard, J.J.; Durrant-whyte, H.F. (1991). "Simultaneous map building and localization for an autonomous mobile robot". Intelligent Robots and Systems' 91.'Intelligence for Mechanical Systems, Proceedings IROS'91. IEEE/RSJ International Workshop on: 1442–1447. doi:10.1109/IROS.1991.174711. ISBN 978-0-7803-0067-5.
  28. Knight, Will (September 16, 2015). "With a Roomba Capable of Navigation, iRobot Eyes Advanced Home Robots". MIT Technology Review (英文). 喺2018-04-25搵到.

連出去 編輯