對極幾何
對極幾何(英文:Epipolar geometry)係處理立體視覺嘅幾何,意指兩台相機從兩笪埞唔同嘅嚟睇一幅 3D 場景嗰陣(可以3D物體,或者佢上高嘅一粒點或者一條線),啲3D 點戥佢哋啲 2D 投影存在有好多啲幾何拏褦,啲喺圖像點之間造成咗一啲約束條件。一般嚟講,啲拏褦可以基於近似假設相機成針孔相機模型推導出嚟;但一啲特殊嘅相機(譬如推掃式嘅)會需要到遞啲模型。對極幾何係八點算法或者多視角幾何嘅基礎概念,雖然啲後者對原本嘅過程有返唔同程度嘅擴展。
定義
編輯下圖描繪咗兩台睇住 點嘅針孔相機。喺真實嘅相機中,圖像面實際上係擺喺焦點後(試惗相機CCD),並產生啲圖像係關於鏡頭焦點中心對稱嘅。之不過,爲咗方便,對極幾何入便擺啲圖像面去焦點中心(即Cardinal point)前面(圖中兩幅灰藍色面),嚟保持啲圖像上下左右嘸因對稱性而翻轉。其中, 同 代表緊兩台相機鏡頭嘅對稱中心。 作爲兩台相機關注緊嘅點,個點 同個 即係點 喺啲圖像面上嘅投影。
每台相機都影到 3D 世界嘅 2D 圖像。噉樣嘅從 3D 到 2D 嘅轉換喊做透視投影,係攞針孔相機模型嚟描述。建模好多時係透過啲射線係從某相機發出而且穿過佢個焦點中心嘅嚟做投影。每條發出嘅光線對應圖像嗰度嘅一粒點。
相關概念
編輯兩粒相機焦點中心連成嘅線 係「基線」(英文:baseline),條線戥粒 3D 點構成嘅平面喊做「對極平面」(圖中綠色面,英文:epipolar plane)。基線戥兩幅圖像交叉嘅兩粒點 、 喊做「對極點」(英文:epipole,epipolar point),係邊一幅圖像就係邊一台相機嘅對極點;亦都可以話,係台相機個中心發嘅射線穿過第個中心嗰陣,戥台機幅圖像面交叉嘅點。一條「對極線」(英文:epipolar line)係喺一幅圖像上,投影點譬如 戥對極點 連成嘅線 ;對極線亦都可以話係幅對極平面戥兩便圖像面嘅兩條交線,或者話係喺一幅圖像度睇到嘅一串點重疊(圖中 疊成 )、喺第幅圖像度反映成嘅線( )。
特殊情況下,兩台相機圖像面係平行嘅嗰陣(或者一台相機平行圖像面嚟移動),條基線亦都平行於啲圖像面,而啲對極線係一排平行線(交於無限遠)。
對極約束
編輯令 係兩便參考系之間嘅旋轉同平移,點 喺兩個參考系入便啲坐標( 同 )可以透過 表示到。乘埋反對稱矩陣(skew-symmetric matrix) ,因爲佢戥 正交,所以 :
再乘埋 ,因爲佢戥 正交,得到
即有對極約束(epipolar constraint)式:
令 ,即當乘積 係本質矩陣(essential matrix),所以改寫成:
對於啲圖像面座標 ,同埋某個對應嘅深度距離 ,有:
所以從一幅圖面轉到另一幅圖面嘅對極約束式都幾乎相同:
未校準相機
編輯相機座標系啲點座標未必可以代表佢喺圖像上對應像素點;所以引入校準矩陣 (calibration matrix),係噉啲圖像面座標 同埋參考系座標 到像素座標 嘅轉換可以寫得成:
係噉原對極約束式可以轉成式:
令 ,即當乘積 係基礎矩陣(fundamental matrix),可以改寫成未校準相機嘅對極約束式:
另外,從對極平面直接映射可以有以下證明[1]:
令 點 喺兩便圖像噶投影點座標,因爲 喺經 嘅射線上,所以有對極線 、上高有點 嘅;因爲 都係 喺對極平面 嘅像,因爲兩者射影等價於點集 (即點集喺左圖像面啲投影 戥右圖像面啲投影 等價),所以互相之間有2D單映射關係 ;因爲對極線係穿過對極點,所以 ;係噉可以令 。而對於某一點 喺 上,有 ,即有對極約束條件。
對極約束同三角測量
編輯若果兩台相機嘅相對位置已知,有以下兩個重要嘅觀察結果:
簡化案例
編輯對極幾何可以簡化,如果兩台相機啲圖像平面吻合嘅話。喺種情況下,對極線亦都吻合埋( = )。另外,啲對極線係平行於基線 ,而且可以喺實踐中戥所述兩個圖像嘅水平軸對齊返。噉樣即係對於一幅圖像啲每粒點,只需沿水平線查睇就搵得到佢對應第幅圖像粒點。[2]
如果相機位置唔可以噉擺法,係噉嚟自啲相機嘅嗰啲圖像坐標可以轉換到模擬得出有返公共嘅圖像面。個過程喊做圖像校正。
推掃式相機嘅對極幾何
編輯戥使用二維CCD嘅傳統frame相機唔同,推掃式相機(Push broom scanner)採用一維CCD陣列來產生又長又連續嘅圖像帶,叫做「圖像地毯」。呢種傳感器嘅對極幾何形狀戥針孔投影相機嘅極線幾何形狀完全唔同。首先,推掃式傳感器嘅對極線唔係直線,而係雙曲線。其次,對極「曲線」pair唔存在。 [3]之喺一些特殊條件下,衛星圖像嘅對極幾何可以認為係一種線性模型。 [4]
睇埋
編輯考
編輯- ↑ Hartley, Richard; Zisserman, Andrew (2003). Multiple View Geometry in computer vision. Cambridge University Press. ISBN 0-521-54051-8.
- ↑ Amato, Alberto; Lecce, Vincenzo Di; Vincenzo, Piuri (2012). Semantic Analysis and Understanding of Human Behavior in Video Streaming. Springer Science & Business Media. p. 47.
- ↑ Jaehong Oh. "Novel Approach to Epipolar Resampling of HRSI and Satellite Stereo Imagery-based Georeferencing of Aerial Images" 互聯網檔案館嘅歸檔,歸檔日期2012年3月31號,., 2011, accessed 2011-08-05.
- ↑ Nurollah Tatar and Hossein Arefi. "Stereo rectification of pushbroom satellite images by robustly estimating the fundamental matrix", 2019, pp. 1–19 accessed 2019-06-03.
讀埋
編輯- Richard Hartley and Andrew Zisserman (2003). Multiple View Geometry in computer vision. Cambridge University Press. ISBN 0-521-54051-8.,電腦視覺嘅經典著作之一。
- Quang-Tuan Luong. "Learning Epipolar Geometry". Artificial Intelligence Center. SRI International. 喺2007-03-04搵到.
- Robyn Owens. "Epipolar geometry". 喺2007-03-04搵到.
- Linda G. Shapiro and George C. Stockman (2001). Computer Vision. Prentice Hall. pp. 395–403. ISBN 0-13-030796-3.
- Vishvjit S. Nalwa (1993). A Guided Tour of Computer Vision. Addison Wesley. pp. 216–240. ISBN 0-201-54853-4.
- Roberto Cipolla and Peter Giblin (2000). Visual motion of curves and surfaces. Cambridge University Press, Cambridge. ISBN 0-521-63251-X.