| 企服解答
大數據工作者可以施展拳腳的領域非常廣泛,從國防部、互聯網創業公司到金融機構,到處需要大數據項目來做創新驅動。目前大數據的工作分為Hadoop大數據開發方向、數據挖掘、機器學習方向、大數據運維方向三個方向。
大數據是什么工作
1、Hadoop大數據開發方向
Hadoop里面包括幾個組件HDFS、MapReduce和YARN,HDFS是存儲數據的地方就像我們電腦的硬盤一樣文件都存儲在這個上面,MapReduce是對數據進行處理計算的,它有個特點就是不管多大的數據只要給它時間它就能把數據跑完,但是時間可能不是很快所以它叫數據的批處理。
2、機器學習方向
機器學習屬于人工智能研究與應用的一個分支領域。機器學習的研究更加偏向理論性,其目的更偏向于是研究一種為了讓計算機不斷從數據中學習知識,而使機器學習得到的結果不斷接近目標函數的理論。
機器學習,引用卡內基梅隆大學機器學習研究領域的著名教授Tom Mitchell的經典定義:如果一個程序在使用既有的經驗E(Experience)來執行某類任務T(Task)的過程中被認為是“具備學習能力的”,那么它一定要展現出:利用現有的經驗E,不斷改善其完成既定任務T的性能(Performance)的特質。
3、大數據運維方向
這里說的大數據運維主要是指hadoop生態體系方面的運維,在一些小公司或者傳統行業的大公司也會使用oracle、db2等技術棧,在互聯網行業數據量稍微大點的公司基本都是使用hadoop技術棧,像在電信或者銀行領域基本上是oracle/db2、hadoop同時使用。
| 拓展閱讀
目前大數據在各行各業中都能夠得到應用
1、醫療器械職業
醫療器械職業有著許許多多的病案,病理陳述,痊愈計劃以及藥品陳述這些。在未來,憑借著數據管理平臺,人們可以收集不一樣的病案與治療計劃及其患者的本質特征,可以創立有關病癥特性的數據庫查詢。
2、生物大數據
自人類基因組計劃完成以來,以美國為代表,世界主要發達國家紛紛啟動了生命科學基礎研究計劃,如國際千人基因組計劃、DNA百科全書計劃、英國十萬人基因組計劃等。這些計劃引領生物數據呈爆炸式增長,目前每年全球產生的生物數據總量已達EB級,生命科學領域正在爆發一次數據革命,生命科學某種程度上已經成為大數據科學。
3、金融交易
大數據在金融行業的應用主要是在金融交易。高頻交易(HFT)是大數據應用比較多的領域。其中,大數據算法被用來作出交易決定。現在,大多數股權交易都是通過大數據算法進行,這些算法越來越多地開始考慮社交媒體網絡和新聞網站的信息來在幾秒內做出買入和賣出的決定。
[免責聲明]
文章標題: 大數據是什么工作
文章內容為網站編輯整理發布,僅供學習與參考,不代表本網站贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題,請及時溝通。發送郵件至36dianping@36kr.com,我們會在3個工作日內處理。