R 語言係指一套開放源碼統計程式語言。R 喺統計、數據探勘等等嘅範圍有好多應用。好多數據科學家覺得同 R、PythonSQL 係入門必學嘅程式語言[未記出處或冇根據]

R 個嘜頭

基礎

編輯

用 R 語言寫嘅程式可以做各種嘅統計分析,例如以下係用 RStudio 整拃數據出嚟,再對拃數據行邏輯迴歸分析[1]

# 用常態分佈,產生 40 件數據,平均值 100 標準差 20,數據擺入 IQ。
IQ <- rnorm(40, 100, 20)
 
# 將 IQ 啲數據由細至大排好。
IQ <- sort(IQ)
 
# 產生個向量,表示 40 個學生啲成績,0 表示肥佬而 1 表示合格。
result <- c(0, 0, 0, 1, 0, 0, 0, 0, 0, 1,
1, 0, 0, 0, 1, 1, 0, 0, 1, 0,
0, 0, 1, 0, 0, 1, 1, 0, 1, 1,
1, 1, 1, 0, 1, 1, 1, 1, 0, 1)
 
# 用 df 儲住啲數據
df <- as.data.frame(cbind(IQ, result))
 
# 用 df 行個邏輯迴歸(基本上等同 binomial glm)
g = glm(result~IQ, family=binomial, df)
 
# 畀出 g 嘅總結-g 會包含個模型啲 beta 同埋統計顯著度等嘅資訊。
summary(g)

主要功能

編輯

數據引入

編輯

數據結構

編輯

數據視化

編輯
内文:R 包

機械學習

編輯

睇埋

編輯