進(jìn)行數(shù)據(jù)分析除了需要良好的數(shù)學(xué)統(tǒng)計(jì)基礎(chǔ),對數(shù)據(jù)的敏感性外,有一位熟練使用的“老手”是非常重要的,數(shù)據(jù)分析的軟件類型有:Excel、SQL、BI、統(tǒng)計(jì)編程、數(shù)據(jù)可視化JavaScript庫、R語言等等。
數(shù)據(jù)分析的軟件有什么?數(shù)據(jù)分析的軟件推薦!
1、Excel數(shù)據(jù)處理
Excel:數(shù)據(jù)的加工以及分析處理,這個(gè)工具不用多說,不會這個(gè)基本和數(shù)據(jù)分析這個(gè)工作也就沒有了,可以說這玩意是數(shù)據(jù)分析的基礎(chǔ)軟件工具,掌握它對我們后面進(jìn)一步學(xué)習(xí)使用BI工具或統(tǒng)計(jì)編程工具有很大幫助。
它的功能很強(qiáng)大,數(shù)據(jù)分析中最常用的功能有:數(shù)據(jù)透視表、分析工具庫、可視化圖表、自動化數(shù)據(jù)處理、快速實(shí)現(xiàn)業(yè)務(wù)報(bào)表開發(fā)等等,它的數(shù)據(jù)輸入可以是手工輸入,也可以是通過各類標(biāo)準(zhǔn)文件導(dǎo)入,也可以是使用“Power Query”功能實(shí)現(xiàn)從數(shù)據(jù)庫取數(shù)。
2、數(shù)據(jù)庫操作
SQL:結(jié)構(gòu)化數(shù)據(jù)查詢,主要用于查詢關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù),例如:Oracle、SQL Server、MySQL、Hive、PosgreSQL等。
3、BI工具
BI(Business Intelligence 商業(yè)智能)工具不僅僅是數(shù)據(jù)可視化,更是智能數(shù)據(jù)分析工具,可以大大提高數(shù)據(jù)分析的效率。主要有以下2款:
Tableau BI:數(shù)據(jù)可視化軟件,相比Excel,能夠支持更多數(shù)據(jù)的可視化。不免費(fèi),但是淘寶上有低價(jià)格的專業(yè)版key賣一年幾十塊。
PowerBI:和Tableau類似的數(shù)據(jù)可視化軟件,微軟出品,PowerBI Desktop免費(fèi),免費(fèi)版也可以在PowerBI Service上進(jìn)行公開分享,但是如果需要按角色分享就需要付費(fèi)了,或者更多企業(yè)云上功能也需要付費(fèi)。但是免費(fèi)版本的PowerBI Desktop足以完成所有工作。
其實(shí)PowerBI和Tableau的核心本質(zhì)是一樣的,這個(gè)核心就是Excel的數(shù)據(jù)透視表和數(shù)據(jù)透視圖。它們都是通過拖拽字段的方式,實(shí)現(xiàn)數(shù)據(jù)透視分析,并一鍵生成圖表。這也是為什么說如果你對Excel數(shù)據(jù)透視表很掌握,再去學(xué)習(xí)這兩門工具上手會很快。
4、統(tǒng)計(jì)編程
一款菜單式統(tǒng)計(jì)工具:SPSS,三款統(tǒng)計(jì)編程工具:SAS、Python、R
常用的統(tǒng)計(jì)模型(或方法):
數(shù)據(jù)的點(diǎn)估計(jì)、區(qū)間估計(jì)、方差分析
各種假設(shè)檢驗(yàn)(卡方檢驗(yàn)、t檢驗(yàn)、F檢驗(yàn)、正態(tài)性檢驗(yàn)等)
數(shù)據(jù)降維(如主成分分析、因子分析等)
常用的數(shù)據(jù)挖掘模型:
預(yù)測類算法(如多元線性回歸模型、決策樹模型、隨機(jī)森林模型、K近鄰算法、支持向量機(jī)SVM模型等)
分類算法(如Logistic回歸模型、貝葉斯算法、提升樹GBDT算法等)
聚類算法(如K均值聚類、層次聚類、密度聚類等)
5、數(shù)據(jù)可視化JavaScript庫
Echarts和JavaScript數(shù)據(jù)可視化庫,用于制作數(shù)據(jù)可視化網(wǎng)頁。
6、R語言
R是用于統(tǒng)計(jì)分析、繪圖的語言和操作環(huán)境。R是屬于GNU系統(tǒng)的一個(gè)自由、免費(fèi)、源代碼開放的軟件,它是一個(gè)用于統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)制圖的優(yōu)秀工具。R是用于統(tǒng)計(jì)分析、繪圖的語言和操作環(huán)境。R是屬于GNU系統(tǒng)的一個(gè)自由、免費(fèi)、源代碼開放的軟件,它是一個(gè)用于統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)制圖的優(yōu)秀工具。R語言開發(fā)IDE通常使用的是Rstudio,社區(qū)版免費(fèi),通常夠用了。
7、SQL
這里的SQL不是單指mysql或者oracle,亦或者h(yuǎn)ive等,而是指標(biāo)準(zhǔn)SQL查詢語言。數(shù)據(jù)庫可以存儲大量的數(shù)據(jù),通過SQL可以進(jìn)行復(fù)雜的數(shù)據(jù)關(guān)聯(lián)查詢,比如幾張表之間的關(guān)聯(lián)信息。寫好SQL,也能高效的挖掘出數(shù)據(jù)之間的關(guān)系,做出最有商業(yè)價(jià)值的數(shù)據(jù)分析報(bào)表。
通過數(shù)據(jù)分析來實(shí)現(xiàn)軟件和數(shù)據(jù)之間的平衡。資料分析要大量使用資料集合,數(shù)據(jù)分析手段,所用資料儲存的特殊技術(shù),如深度分析法,以資料庫為基礎(chǔ),建立以工具書為基礎(chǔ)的硬件資料分析系統(tǒng),資料儲存于軟體或硬體,以便在整個(gè)軟體發(fā)展、制造過程中,能有效運(yùn)用。
[免責(zé)聲明]
文章標(biāo)題: 數(shù)據(jù)分析的軟件有什么?數(shù)據(jù)分析的軟件推薦!
文章內(nèi)容為網(wǎng)站編輯整理發(fā)布,僅供學(xué)習(xí)與參考,不代表本網(wǎng)站贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時(shí)溝通。發(fā)送郵件至36dianping@36kr.com,我們會在3個(gè)工作日內(nèi)處理。