| 企服解答
從大的知識體系結構來看,學習大數據需要具備三方面基礎,分別是數據庫知識、數學和統計學知識、計算機知識,選擇不同的主攻方向還需要有不同的學習側重點。
學大數據需要具備什么基礎
1、數據庫知識
數據庫知識是學習大數據相關技術的重要基礎,大數據的技術體系有兩大基礎,一部分是分布式存儲,另一部分是分布式計算,所以存儲對于大數據技術體系有重要的意義。初學者可以從Sql語言開始學起,掌握關系型數據庫知識對于學習大數據存儲依然有比較重要的意義。另外,在大數據時代,關系型數據庫依然有大量的應用場景。
2、數學和統計學知識
從大數據崗位的要求來看,大數據分析崗位(算法)對于數學和統計學知識的要求程度比較高,大數據開發和大數據運維則稍微差一些,所以對于數學基礎比較薄弱的初學者來說,可以考慮向大數據開發和大數據運維方向發展。
3、計算機基礎知識
計算機基礎知識涉及到三大塊內容,包括操作系統、編程語言和計算機網絡,其中操作系統要重點學習一下Linux操作系統,編程語言可以選擇Java或者Python。如果要從事大數據開發,應該重點關注一下Java語言,而如果要從事大數據分析,可以重點關注一下Python語言。計算機網絡知識對于大數據從業者來說也比較重要,要了解基本的網絡通信過程,涉及到網絡通信層次結構和安全的相關內容。
| 拓展閱讀
關于大數據技術主要具有以下四個方面的特點:
1、大數據技術可存儲巨量數據
大數據技術一般指的是芯片存儲技術,可存儲數據超過宇宙天體數的三倍以上,互聯網一天所產生的數據內容可以刻滿1.68億張DVD,相當于《時代》雜志770年的文字量。芯片存儲技術可存儲的數據能夠達到千萬億(PB)、百億億(EB)乃至十萬億億(ZB)的級別。
2、大數據技術可以抓取、收集類型繁雜的數據
包括各種各樣的語音、非結構化數據、圖像、文本信息、地理位置信息、網絡文章等。聯合包裹速遞服務公司(UPS)早在2009年就開發了行車整合優化和導航大數據技術系統(ORION)對快遞線路進行預測和優化,截至2013年底,ORI?ON系統已經在大約一萬條線路上得到使用,在多送出42萬件包裹的情況下,為公司節省燃料150萬噸,少排放二氧化碳1.4萬立方米,大數據技術正在引導物流企業將洞察力快速轉化為公司決策。
3、大數據分析具有較高的商業價值和應用價值。
物流領域的數據量是非常巨大的,包括來自企業、互聯網、港口、運載工具等的數據,如何從如此巨大的數據中挖掘企業所需的數據資料,就需要借助大數據分析技術,如利用大數據來分析集裝箱移動信息,物流企業就能知道哪些港口有剩余運載量,哪些港口吞吐量大,貨物周轉速度快,應在哪個位置的港口部署海運業務,大數據已經成為智慧物流的引擎。
4、計算速度快。
采用非關系型數據庫技術(NoSQL)和數據庫集群技術(MPP NewSQL)快速處理非結構化以及半結構化的數據,以獲取高價值信息,這與傳統數據處理技術有著本質的區別。
[免責聲明]
文章標題: 學大數據需要具備什么基礎
文章內容為網站編輯整理發布,僅供學習與參考,不代表本網站贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題,請及時溝通。發送郵件至36dianping@36kr.com,我們會在3個工作日內處理。