【數據挖掘知識分享】機器學習平臺——回歸算法簡介

美林數據技術股份有限公司
關注
2022-09-20 17:07
614次閱讀
數值預測是對連續值函數進行預測的一類數據挖掘任務,通過構造相關的預測模型對連續數值進行預測。與分類問題相同之處在于數值預測也是有標號的學習問題,即監督學習問題,與之不同在于數值預測對連續的變量進行學習和預測,而分類對于離散的目標進行學習和分類。
回歸分析是最常用的統計學數值預測方法,它是在分析現象自變量和因變量之間相關關系的基礎上,建立變量之間的回歸方程,并將回歸方程作為預測模型,根據自變量在預測期的數量變化來預測因變量的值。
回歸分析主要解決以下幾個方面的問題:
- 確定幾個特定的變量之間是否存在相關關系, 如果存在的話, 找出它們之間合適的數學表達式。
- 根據一個或幾個變量的值, 預測或控制另一個變量的取值, 并且可以知道這種預測或控制能達到什么樣的精確度。
- 進行因素分析。例如在對于共同影響一個變量的許多變量(因素)之間,找出哪些是重要因素,哪些是次要因素,這些因素之間又有什么關系等等。
回歸分析有很廣泛的應用, 例如實驗數據的一般處理, 經驗公式的求得, 因素分析, 產品質量的控制, 氣象及地震預報, 自動控制中數學模型的制定等等。多元回歸分析是研究多個變量之間關系的回歸分析方法,按因變量和自變量的數量對應關系可劃分為一個因變量對多個自變量的回歸分析(簡稱為“一對多”回歸分析)及多個因變量對多個自變量的回歸分析(簡稱為“多對多”回歸分析),按回歸模型類型可劃分為線性回歸分析和非線性回歸分析。
回歸結果一般用預測誤差來度量,常用的誤差有:
?均方誤差
?均方根誤差
?解釋方差
?平均絕對誤差
?R-平方系數
常見的回歸算法⇒線性回歸
⇒邏輯回歸
⇒多項式回歸
⇒逐步回歸
⇒嶺回歸
⇒套索回歸
⇒ElasticNet回歸
Tempo機器學習平臺內集成的回歸方法包括線性回歸,決策樹回歸,隨機森林回歸,KNN回歸,支持向量機回歸等。
后續我們將會針對每個回歸算法做詳細的解釋。

美林數據技術股份有限公司
+
關注
0