當(dāng)我們真正要開始構(gòu)建推薦系統(tǒng)的時候,我們首先要從四個方面來考慮。首先是算法。究竟該選擇什么樣的算法?無論是協(xié)同過濾還是其他算法,都要基于自己的業(yè)務(wù)產(chǎn)品。第二是數(shù)據(jù)。當(dāng)確定了算法時,應(yīng)該選擇哪種數(shù)據(jù)?如何處理數(shù)據(jù)?用什么樣方法采集數(shù)據(jù)?有句話叫做“機器學(xué)習(xí)=模型+數(shù)據(jù)”,即便擁有了一個很復(fù)雜的模型,在數(shù)據(jù)出現(xiàn)問題的情況下,也無法在推薦系統(tǒng)里面發(fā)揮很好的效果。第三,在線服務(wù)。當(dāng)模型訓(xùn)練完畢,數(shù)據(jù)準(zhǔn)備充分之后,就會面對接收用戶請求返回推薦結(jié)果的事項,這其中包含兩個問題。其一,返回響應(yīng)要足夠迅速。如果當(dāng)一個用戶請求后的一秒鐘才返回推薦結(jié)果,用戶很可能因喪失耐心而流失。其二,如何讓推薦系統(tǒng)具有高可擴(kuò)展性。當(dāng) DAU 從最初的十萬漲到一二百萬時,推薦系統(tǒng)還能像最初那樣很好地?fù)踝〈篌w量的請求嗎?這都是在線服務(wù)方面需要考慮和面臨的問題。第四,評估效果。做好上述三點,并不代表萬事大吉,一方面,我們要持續(xù)迭代推薦算法模型與結(jié)構(gòu),另一方面要去構(gòu)建一套比較完整、系統(tǒng)的評價體系和評估方法,去分析推薦效果的現(xiàn)狀以及后續(xù)的發(fā)展。
神策推薦系統(tǒng)是一個完整的學(xué)習(xí)閉環(huán)。收集基礎(chǔ)數(shù)據(jù),通過機器學(xué)習(xí)算法模型形成應(yīng)用。結(jié)果實時驗證,從而指導(dǎo)數(shù)據(jù)源添加,算法反饋優(yōu)化形成一個全過程、實時、自動、快速迭代的推薦閉環(huán)。
收起