電腦視覺

(由機械視覺跳轉過來)

電腦視覺computer vision)係人工智能嘅一個子領域,涉及科學家嘗試教電腦做人類視覺系統做到嘅工作-電腦視覺涉及研究教電腦由睇到嘅影像當中分辨睇到啲乜嘢物件、判斷周圍物件嘅位置(呢種技術對自駕車嚟講好有用)、以至認人樣等等[1]

例子

事先處理

電腦視覺程式會由某啲型式嘅光感應器嗰度得到訊號,再將訊號轉化做電腦記得住嘅碼。舉個例說明,喺用紅綠藍色彩模式(RGB model)將一幅圖存入去佢嘅記憶體嗰陣,部電腦會記住「 」噉嘅一系列數字,每組數字有三個數,每個最細係 0 最大係 255,第一個數代表嗰一點有幾多紅(R),第二個數代表嗰一點有幾多綠(G),而第三個數代表嗰一點有幾多藍(B),而成串嘢當中有   組「每組三個數」嘅數-  就係幅圖嘅象素;最後形成一個矩陣,令到部電腦可以記住幅圖嘅樣[2]

運算方法

喺做咗事先處理(preprocessing)之後,影像數據就可以用好多演算法嚟處理。想像一個人工神經網絡(artificial neural network),一個簡單嘅前饋人工神經網絡分若干層,每層有若干粒人工神經細胞(artificial neuron),每粒人工神經細胞都有個數值,個數代表佢嘅啟動程度(activation level),而每粒神經細胞嘅啟動程度嘅數值都有條式計,呢條式包括咗喺佢之前嗰啲神經細胞嘅啟動程度,即係話個程式會有一條類似噉樣嘅算式:

 

喺呢條式當中,  代表嗰粒神經細胞嘅啟動程度,  代表其他神經細胞當中第   粒嘅啟動程度,而   就係其他神經細胞當中第   粒嘅權重(指嗰粒神經細胞有幾影響到   嗰粒神經細胞嘅啟動程度)。所以當一粒人工神經細胞啟動嗰陣,會帶起佢後面啲人工神經細胞跟住佢啟動-似十足生物神經網絡入面嗰啲神經細胞噉。最前嗰層有   粒細胞,每   粒細胞代表幅輸入圖像嘅像素嘅色水,而最後嗰層有一粒細胞,呢粒細胞有兩個可能數值,1(陽性)同 0(陰性)[3]

機械學習

跟住研究者要個網絡做學習:個研究者走去搵柞數據返嚟-呢柞數據就係所謂嘅訓練集(training set);呢個訓練集會包括咗一連串嘅輸入個案,每個個案都係一幅影X 光片,而已知啲個案當中邊個有肺癌邊個冇;跟手個研究者就可以將個訓練集嘅數據入落去個神經網絡做輸入,等部電腦計出喺每一個個案入面,個神經網絡俾出嚟嘅輸出(即係佢對「呢幅 X 光片個人係咪有肺癌」嘅診斷)同正確嘅輸出值有幾大出入,跟手事先編寫好嘅學習法則就會按照呢啲落差值計吓啲權重要點變,先可以令到個神經網絡俾出更準確嘅答案。如是者,喺個神經網絡運算過大量嘅個案之後,佢嗰啲權重等嘅參數就會有所改變,變到更加能夠計到正確嘅答案-個研究者就可以攞呢個神經網絡嚟去做將來嘅肺癌診斷。呢種用電腦視覺做醫療診斷嘅做法喺廿一世紀醫學上經已取得咗相當嘅成功[4][5]

睇埋

  1. Dana H. Ballard; Christopher M. Brown (1982). Computer Vision. Prentice Hall.
  2. Rudolf F. Graf (1999). Modern Dictionary of Electronics. Oxford: Newnes. p. 569.
  3. "Artificial Neural Networks as Models of Neural Information Processing | Frontiers Research Topic". Retrieved 2018-02-20.
  4. Haykin, S. S., Haykin, S. S., Haykin, S. S., Elektroingenieur, K., & Haykin, S. S. (2009). Neural networks and learning machines (Vol. 3). Upper Saddle River: Pearson education.
  5. Jain, A. K., Mao, J., & Mohiuddin, K. M. (1996). Artificial neural networks: A tutorial. Computer, (3), 31-44.