降維粵拼gong3 wai4 | 英文dimension reduction)喺統計學機械學習上係指「減少手上考慮嘅隨機變數嘅數量」嘅過程。常見嘅降維方法有主成份分析同埋因素分析呀噉。

主成分分析嘅圖解;幅圖每一點代表一個個案,兩個箭咀代表兩個成份,長啲嗰個箭咀係比較重要嗰個成份。

基本諗頭

編輯

降維係指減低手上拃 datadei1 taa4)入面隨機變數嘅數量,簡單例子可以想像而家要分析 1,000 隻蝴蝶,手上嘅 data 描述

蝴蝶 0001 翼係咩形狀、色水係點、有乜花紋...
蝴蝶 0002 翼係咩形狀、色水係點、有乜花紋...
蝴蝶 0003 翼係咩形狀、色水係點、有乜花紋...

要做降維嘅話,就可能係按呢啲 data 將啲蝴蝶分做唔同嘅物種,噉就變成

蝴蝶 0001 屬於物種 A / 蝴蝶 0002 屬於物種 B / 蝴蝶 0003 屬於物種 C...

—令到啲 data 嘅維度下降咗,用日常用語講即係令啲 data 易睇咗。做研究嗰陣,降維好多時都能夠令到啲 data 更易處理。

主成份分析

編輯

主成份分析(PCA)係一種常用嚟判斷「邊個變數重要啲」嘅統計分析方法。

線性判別

編輯

因素分析

編輯
内文:因素分析

因素分析(FA)將大量嘅變數轉化做少量因素,當中「因素」通常係一啲數值冇得直接量度嘅嘢,所以就要由量度到嗰啲變數嚟「反映」佢哋。例如智商測驗(講緊正式心理學上會用嗰啲)就係因素分析嘅一個應用例子:智商測驗旨在量度智能,但係智能(因素)呢家嘢冇得話攞把尺去量度,一個個體嘅智能值只可以靠住由測驗題目攞到嘅分數(量度得到嘅變數)嚟反映[1]

睇埋

編輯

引咗

編輯
  1. Child, Dennis (2006), The Essentials of Factor Analysis (3rd ed.), Continuum International.

連結

編輯