国产精一区二区_午夜视频99_免费白白视频_中文字幕一区免费

【數據挖掘算法分享】機器學習平臺——回歸算法之線性回

美林數據技術股份有限公司
+ 關注
2022-09-20 17:07
577次閱讀

【數據挖掘算法分享】機器學習平臺——回歸算法之線性回

其中J(θ), 為W^T*X和Y的函數。目標函數包含兩部分內容,正則項用于控制模型的復雜度(最小化結構風險函數),損失用于度量擬合誤差(通常使用均方誤差),目標函數通常為w的凸函數。正則項參數 λ>0(regParam)為最小化誤差和模型復雜度之間提供了一種折中(如,用來避免過擬合)。

線性回歸算法的整個步驟如下:

(1)給定訓練數據樣本集

【數據挖掘算法分享】機器學習平臺——回歸算法之線性回

選取初值θ0,給定收斂容差 ε,最大迭代次數K,然后解下面優化問題:

【數據挖掘算法分享】機器學習平臺——回歸算法之線性回

【數據挖掘算法分享】機器學習平臺——回歸算法之線性回

(2)采取下面公式更新θ

【數據挖掘算法分享】機器學習平臺——回歸算法之線性回

(3)當或者k<K ,輸出θ,否則轉步驟2.

【數據挖掘算法分享】機器學習平臺——回歸算法之線性回

(4)構造回歸決策函數

【數據挖掘算法分享】機器學習平臺——回歸算法之線性回

線性回歸適合分布式實現,能支持大數據量建模。

線性回歸算法假設每個影響因素與目標之間是線性關系,并通過特征選擇,得到關鍵影響因素的線性回歸系統。該算法是利用數理統計中回歸分析,來確定兩種或兩種以上變量間相互依賴的定量關系的一種統計方法,通過凸優化的方法進行求解。在實際業務中應用十分廣泛。下面演示下Tempo機器學習平臺中線性回歸算法的使用方法。

數據格式

必須設置類屬性(輸出),且類屬性(輸出)必須是連續型(數值);

非類屬性(輸入)可以是連續型(數值)也可以是離散型(名詞);

參數說明

【數據挖掘算法分享】機器學習平臺——回歸算法之線性回

參數 類型 描述 數據標準化 下拉框 設置數據標準化的方法,字符型,取值范圍:無處理,歸一化,標準化,默認值為無處理 取值區間下限 文本框 設置歸一化取值區間下限,浮點型,取值范圍:[0,∞),默認值為0 取值區間上限 文本框 設置歸一化取值區間上限,浮點型,取值范圍:[0,∞),默認值為1 正則化參數 文本框 正則化參數控制機器的復雜度,浮點型,取值范圍:[0,∞),默認值為0.01 收斂容差 文本框 設置終止迭代的誤差界,浮點型,取值范圍:[0,∞),默認值為0.000001 最大迭代次數 文本框 設置最大迭代次數,整型,取值范圍:[1,∞),默認值為100 罰函數類型 下拉框 設置懲罰函數類型,0對應L2罰函數,1對應L1罰函數,(0,1)之間對應L1和L2的組合罰函數。浮點型,取值范圍:[0,1],默認值為0 求解方法 下拉框 選擇線性回歸的求解方法,文本型,取值范圍:Auto,L-BFGS,Normal (Normal->加權最小二乘法,L-BFGS->牛頓法,Auto->算法自動選取(L-BFGS,Normal)中的一種)。默認值為Auto 是否顯示變量重要性 復選框 用戶選擇是否分析每個變量對于回歸結果的影響程度,如果選擇是,則在洞察中顯示參與建模的每個變量對于模型的貢獻程度情況

結果說明

【數據挖掘算法分享】機器學習平臺——回歸算法之線性回

線性回歸的方程及其系數。

【數據挖掘算法分享】機器學習平臺——回歸算法之線性回

最后一列屬性“prediction”為回歸預測列。

演示示例

構建如下流程:

【數據挖掘算法分享】機器學習平臺——回歸算法之線性回

【文件輸入】節點配置如下:

【數據挖掘算法分享】機器學習平臺——回歸算法之線性回

【設置角色】節點配置如下:

【數據挖掘算法分享】機器學習平臺——回歸算法之線性回

【線性回歸】節點配置如下:

【數據挖掘算法分享】機器學習平臺——回歸算法之線性回

流程運行結果如下:

【數據挖掘算法分享】機器學習平臺——回歸算法之線性回

[免責聲明]

原文標題: 【數據挖掘算法分享】機器學習平臺——回歸算法之線性回

本文由作者原創發布于36氪企服點評;未經許可,禁止轉載。

資深作者美林數據技術股份有限公司
美林數據技術股份有限公司
0
美林數據技術股份有限公司
實力廠商
實力廠商
優質服務
優質服務
及時響應
及時響應
立即詢價
相關話題
數據分析
相關文章
最新文章
查看更多
關注 36氪企服點評 公眾號
打開微信掃一掃
為您推送企服點評最新內容
消息通知
咨詢入駐
商務合作