學習數據分析?要從這六步走

大數據時代,企業面臨的境況正日益變得更為復雜多變,企業的決策越來越難以靠個人的智力與經驗來應付了,因此現代決策應該更多地依靠科學,對于企業來說,內部海量數據蘊含著大量的“價值金礦”,根據IDC調查的2000多個大中型企業在全球20個國家表明,如果一個公司可以采取一套完整的大數據解決方案(包括數據收集、整合、篩選、分析、共享)。那么,在未來四年中,企業將從其數據資產中發掘出額外60%的數據紅利。這就是為什么企業需要BI商業智能的原因。
說說BI能夠給企業帶來的幾點好處。
1)提高數據分析效率
2)培育數據文化環境
3)輔助領導科學決策
舉幾個例子,一、BI數據分析可以對原始雜亂的數據進行清洗、脫敏、整合、分析和顯示,以提高數據的利用率;二、BI數據分析還可以預測數據,評估風險,協助決策者決策,合理規避風險;三、BI數據分析可以通過可視化的方式,更直觀地顯示數據,讓用戶更直觀地了解數據的價值,達到一圖勝千言的效果。
那么如何做數據分析,數據分析的步驟是什么?
總的來說,數據分析一般可分為六個步驟:1、識別需求→2、確定思路→3、數據收集→4、數據處理→5、數據分析→6、制作報告
數據分析步驟:
第一步、識別需求
識別需求是確保數據分析過程有效性的首要條件,可以為收集數據、分析數據提供清晰的目標,應滿足管理者決策和過程控制的需求,確保數據分析產出滿足管理者的訴求。
第二步、確定思路
分析思想是分析的靈魂,是需求識別到細化分析工作的過程。分析思路清晰有邏輯,能有效避免反復分析問題。從分析目的出發,全面、深入地拆解分析維度,確定分析方法,最終形成完整的數據指標體系。
可以參照5W1H方法:
l Who:數據使用者
l When:數據使用時間
l Where:數據使用場合
l Why:使用數據原因
l What:具體數據格式
第三步、數據收集
按照上一步確定的數據分析內容,來收集相關數據的過程。一般來說,數據可分為原始數據和清洗過的數據。可以利用BI數據連接的功能,可以對關系型數據庫、非關系型數據庫、多維數據庫、Excel文件進行連接。
第四步、數據處理
數據分析80%的時間都是在整理數據,把其變成適合分析的數據。數據處理是數據分析必不可少的階段,涉及到數據的計算、分組、轉換、脫敏等操作,在這一點上,永洪BI通過拖拽的方式就能夠快速滿足用戶數據處理的訴求。
以缺失值處理為例:可以通過以下幾種方式進行處理。
1.用一個樣本統計量的值代替缺失值,一般用的比較多的處理方式就是使用該變量的樣本平均值代替缺失值。
2.用一個統計模型計算出來的值去代替缺失值。例如回歸模型、判別模型等。
3.將有缺失值的記錄刪除,缺點是可能會導致樣本量的減少。
4.將有缺失值的記錄保留,只在相應的分析中做排除。
第五步、數據分析
在完成數據處理之后,就需要通過多種數據分析的方法與模型對處理的數據進行和研究,通過數據分析從中發現數據的內部關系和規律,掌握好這些關系和規律就能夠更好的進行數據分析工作。
常見的數據分析方法包括:對比分析法、分組分析法、結構分析法、平均分析法、交叉分析法、綜合評價分析法、杜邦分析法、漏斗圖分析法、矩陣分析法等。
對比分析法。這種方法分為靜態比較也叫橫比是指在同一時間下比較。動態比較也叫縱比是指在同一條件下的不同時期進行比較。適用于:不同時期比、與目標比、同級部門單位地區比、行業內比、活動效果比等
對于結構分析法也是一種不錯的方法,是指被分析的總體內的各部分與總體間進行對比的分析方法。一般來說在總體內占有的比例越大,說明對總體的影響也就越大。
而漏斗圖分析法適用于業務流程比較規范,周期較長,各流程環節涉及復雜業務過程較多,其實在分析用戶的流失率、購買率轉化率等都可以使用這種方法。
第六步、制作報告
制作報告將數據分析形成的結果進行可視化,并按主題在界面上進行整合,需要注意的幾個點,1、整體布局,需要按用戶角色進行設計,面向高層可以參考領導駕駛艙的設計,從視覺傳達的角度,貼合用戶的角色職能。2、UI設計,需要借鑒公司內部UI標準規范,達到統一、美觀的效果。3、報告內容,可按不同角色進行設計,如:面向高層的戰略看板,一般會通過純數字形式來展示核心指標,不需要復雜的圖表。面向中層的業務看板,注重過程和組成,多使用增長曲線等形式來體現數據分布、規律和變化。
