商業(yè)智能管理功能:從多個數(shù)據(jù)源獲取數(shù)據(jù)、處理多種格式的數(shù)據(jù)、存儲海量數(shù)據(jù)的能力。為輔助這一功能,一些BI系統(tǒng)具備元數(shù)據(jù)管理模塊,即對描述數(shù)據(jù)的數(shù)據(jù)也進行管理。隨著業(yè)務量級的提升、數(shù)據(jù)口徑的日益復雜,不遠的將來我們也會有提升數(shù)據(jù)管理能力的需要,而元數(shù)據(jù)管理就是最好的解決方案。
數(shù)據(jù)分析功能:傳統(tǒng)BI系統(tǒng)具備即席查詢、報表生成、數(shù)據(jù)可視化等數(shù)據(jù)分析功能。而大數(shù)據(jù)時代來臨的意義在于,數(shù)據(jù)的鴻溝正在逐步消除,不僅企業(yè)決策人員能更加方便靈活地操作數(shù)據(jù),普通用戶也有獲取數(shù)據(jù)的需求,企業(yè)滿足用戶這方面的需求,讓用戶分析自己、管理自己,對雙方都會帶來巨大的價值。
新浪微博的數(shù)據(jù)分析插件、淘寶的數(shù)據(jù)魔方等都是正面的成功范例。不幸的是,仍有一些古董級的企業(yè)逆勢而為,力圖加高數(shù)據(jù)壁壘,讓用戶對自己的消費情況查不清、問不明,這只會加速用戶流失。筆者建議這些企業(yè)盡早轉(zhuǎn)變陳腐的觀念,營造透明開放的數(shù)據(jù)環(huán)境,只有擁抱變革,才不會遭受變革。
知識發(fā)現(xiàn)功能:將數(shù)據(jù)中隱含的、潛在有用的而人們又感興趣的部分固化下來形成知識的功能。提取的知識通常表現(xiàn)為概念、規(guī)則、規(guī)律、模式等。筆者認為,知識發(fā)現(xiàn)主要解決who、where、what的問題,即客戶是誰、客戶在哪里、客戶想要什么。
在大數(shù)據(jù)環(huán)境下,人們甚至可以發(fā)現(xiàn)一些難以想象的銷售模式,如沃爾瑪“啤酒與尿布”的經(jīng)典案例。對我們公司來說,這塊能力急需加強。公司領導層多次提到“對圖書和用戶都不了解”,是一個明確的缺乏知識發(fā)現(xiàn)能力的信號。
聯(lián)機分析處理(On-LineAnalytical Processing,OLAP)用于處理聯(lián)機數(shù)據(jù)訪問和分析需求。BI系統(tǒng)需要向決策人員提供高效、直觀的數(shù)據(jù)查詢和展現(xiàn),更方便地輔助決策人員,于是OLAP概念產(chǎn)生了,它將原始的、難以使用的數(shù)據(jù)轉(zhuǎn)化為能夠被理解的、多維的信息,并對多維信息提供鉆取、切片、切塊等操作,從而滿足用戶在各種維度上的數(shù)據(jù)查詢需求。
數(shù)據(jù)挖掘(DataMining,DM)指從海量數(shù)據(jù)中通過某種算法找出隱藏信息的技術。通常包含關聯(lián)分析、聚類分析、異常分析等功能。數(shù)據(jù)挖掘的價值在于,它可利用企業(yè)數(shù)據(jù)進行歸納推理,挖掘出潛在的模式,幫助決策人員制定決策和調(diào)整戰(zhàn)略。數(shù)據(jù)挖掘的存在也是BI系統(tǒng)區(qū)別于傳統(tǒng)報表系統(tǒng)的最主要區(qū)別。
在傳統(tǒng)的技術手段下,BI系統(tǒng)的三大組成部分都可利用關系型數(shù)據(jù)庫(RDBMS)實現(xiàn),許多關系型數(shù)據(jù)庫的生產(chǎn)商,如Oracle、IBM、微軟,同時也是商業(yè)智能解決方案的提供商,可見兩者結(jié)合之緊密。
近年來,隨著大數(shù)據(jù)時代的來臨,非關系型數(shù)據(jù)庫(NoSQL)的優(yōu)勢開始凸顯。許多IT企業(yè),尤其是互聯(lián)網(wǎng)行業(yè),已經(jīng)邁入了SQL和NoSQL并存的時代,非關系型數(shù)據(jù)庫如HBase用于海量數(shù)據(jù)的清洗和處理,關系型數(shù)據(jù)庫如Oracle用于面向用戶的多維查詢和展現(xiàn)。
使用多種數(shù)據(jù)類型綜合決策。以零售業(yè)為例,傳統(tǒng)的線下銷售模式中,企業(yè)的信息化系統(tǒng)中保存的數(shù)據(jù)通常只有訂單數(shù)據(jù),企業(yè)也只關心訂單的狀況和由此生成的財務報表。
顧客的人身特征、詢價過程、物流配送等等信息都被丟棄了。而線上銷售模式中,訂單只是數(shù)據(jù)的一小部分,對企業(yè)更有價值的反而是用戶瀏覽過程、搜索、對比、收藏、詢價、物流、評價這些被傳統(tǒng)行業(yè)遺棄的數(shù)據(jù),甚至很多電商網(wǎng)站費盡心機爬取用戶的其他網(wǎng)頁訪問、位置、通訊錄等數(shù)據(jù)。
姑且不論收集這些數(shù)據(jù)是否合法,至少線上銷售能給客戶帶來更精準的推薦和更個性化的體驗,可以說電商已經(jīng)靠著數(shù)據(jù)革了線下銷售的命。
不再探尋因果,而探尋關聯(lián)。傳統(tǒng)行業(yè)喜歡使用因果論來指導經(jīng)營,如“買了籃球——推薦籃球鞋”、“因為淡季——所以促銷”等。類似的方案需要對行業(yè)本身具備了解,但頻繁使用又會使經(jīng)營模式趨于雷同。
在大數(shù)據(jù)環(huán)境下,我們需要探究的是關聯(lián)而非因果。如沃爾瑪?shù)?ldquo;啤酒和尿布”故事,便是沃爾瑪?shù)臄?shù)據(jù)分析人員找到了兩者的強關聯(lián)而提出的銷售方案。數(shù)據(jù)分析人員無需探究深層次的原因是妻子讓丈夫帶尿布,還是丈夫讓妻子帶啤酒,這根本無關緊要。
從異常數(shù)據(jù)和臟數(shù)據(jù)中淘金。傳統(tǒng)的數(shù)據(jù)倉庫構(gòu)造過程中,異常數(shù)據(jù)、臟數(shù)據(jù)需要在ETL過程中予以剔除,否則將會造成數(shù)據(jù)入庫失敗等各種問題。然而在大數(shù)據(jù)環(huán)境下,異常數(shù)據(jù)卻可能有其價值。
筆者在之前的工作中,發(fā)現(xiàn)每天8點和20點均有大量客戶端訪問錯單,這些記錄均被ETL清洗了。進一步研究發(fā)現(xiàn)這些錯單均為調(diào)用同一個接口導致的,再進一步核查業(yè)務代碼,發(fā)現(xiàn)安卓客戶端在設計時為跟蹤沉默客戶端用戶,每天8點和20點兩個時段客戶端會向服務器發(fā)送握手消息,當客戶端保有量增大時,握手消息使服務器不堪重負,最終產(chǎn)生錯單。
之后的客戶端設計調(diào)整了代碼,將握手機制分散至全天執(zhí)行,減少了服務器負荷,避免根據(jù)錯誤的壓力“峰值”對服務器擴容。又比如,美國一家信用機構(gòu)發(fā)現(xiàn),有10%的“已死亡”客戶仍在正常償還貸款,保留這些異常數(shù)據(jù)而非做銷戶處理,會給企業(yè)帶來額外的利潤。
當然,商業(yè)智能的好處遠不止以上幾點,它帶來的既是機遇,也是挑戰(zhàn)。如何將商業(yè)智能與傳統(tǒng)的數(shù)據(jù)分析相結(jié)合,以產(chǎn)生新的功能,是我們迫切需要思考的問題。以上就是小編為大家?guī)淼纳虡I(yè)智能的好處是什么的介紹,希望對您有幫助。
[免責聲明]
文章標題: 商業(yè)智能的好處是什么?
文章內(nèi)容為網(wǎng)站編輯整理發(fā)布,僅供學習與參考,不代表本網(wǎng)站贊同其觀點和對其真實性負責。如涉及作品內(nèi)容、版權和其它問題,請及時溝通。發(fā)送郵件至36dianping@36kr.com,我們會在3個工作日內(nèi)處理。