Statistics
敘述統計函式
mean(iris$Sepal.Length) #「花萼長度」的平均值 var(iris$Sepal.Length) #「花萼長度」的變異數 sd(iris$Sepal.Length) #「花萼長度」的標準差 median(iris$Sepal.Length) #「花萼長度」的中位數 max(iris$Sepal.Length) #「花萼長度」中的最大值 min(iris$Sepal.Length) #「花萼長度」中的最小值 sum(iris$Sepal.Length) #「花萼長度」加總 range(iris$Sepal.Length) #「花萼長度」最小值和最大值(全距) quantile(iris$Sepal.Length, probs=0.25) # 第一四分位數 quantile(iris$Sepal.Length, probs=0.75) # 第三四分位數
遇到資料有遺漏值的時候,函式往往會無法運作,最後結果如上面顯示是NA。 但如果我們想要把「NA以外的值」加總起來,又該怎麼做? sum(a, na.rm=TRUE) 在函式裡面,果然有na.rm的參數可以設定(預設是FALSE)