国产精一区二区_午夜视频99_免费白白视频_中文字幕一区免费

熱門文章> 機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)算法 >

機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)算法

36氪企服點(diǎn)評小編
2021-07-07 11:05
360次閱讀

       隨著新基建概念的提出,和互聯(lián)網(wǎng)的快速發(fā)展,人工智能、航空航天、VR技術(shù)是未來的大勢所趨,很多人想抓住科技的未來,進(jìn)行機(jī)器學(xué)習(xí)。機(jī)器學(xué)習(xí)會改變我們的生活,接下來,小編就將介紹一些相關(guān)內(nèi)容:機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)算法,一起來看看吧。

機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)算法機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)算法

1.機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)算法

我們有一個常見的步驟,主要包括以下幾個方面:

  • 清楚問題:達(dá)到什么目的
  • 所需的數(shù)據(jù)問題:如果公司有大量的數(shù)據(jù),就能確定最終目標(biāo)是什么;如果沒有,則需要通過目標(biāo)來確定數(shù)據(jù)集。
  • 獲得數(shù)據(jù):企業(yè)內(nèi)部數(shù)據(jù)(項(xiàng)目使用),例如數(shù)據(jù)庫等。
  • 諸如:UCI、GoogleTrends、Kaggle、AWS公共數(shù)據(jù)集、Imagenet、MINIST、麻省理工大學(xué)人臉識別、歌曲數(shù)據(jù)庫、圖像處理COCO、視頻數(shù)據(jù)集youtube等開放源代碼數(shù)據(jù)集。
  • 整理數(shù)據(jù)的格式:通常我們的數(shù)據(jù)大多是數(shù)據(jù)庫的文件數(shù)據(jù),并非里面的所有維度信息都需要用到,所以這里要對其進(jìn)行相應(yīng)的處理。
  • 將收集的數(shù)據(jù)轉(zhuǎn)換成txt、csv、xsl等格式,便于從機(jī)器學(xué)習(xí)庫讀取。對原始數(shù)據(jù)的所有可變因素量化進(jìn)一步轉(zhuǎn)換為包含數(shù)據(jù)(Data)和標(biāo)簽(標(biāo)簽)的數(shù)據(jù)框形式,便于建模。
  • 資料的預(yù)處理
  • 偏移檢測:即檢查產(chǎn)生偏差的因素,識別離散值和噪聲值。
  • 資料清理:即處理丟失的值和噪音。
  • 資料標(biāo)準(zhǔn)化
  • 分割數(shù)據(jù)。
  • 打亂數(shù)據(jù)集,并按7:3或8比2或其他方式分成訓(xùn)練集和測試集。
  • 根據(jù)場景選擇適合的機(jī)器學(xué)習(xí)模型。

       這之后,還需要關(guān)注維度大小,也就是關(guān)注數(shù)據(jù)質(zhì)量和它的特征屬性,關(guān)注可用計(jì)算資源。項(xiàng)目小組會對工程進(jìn)度進(jìn)行預(yù)測,確定手持?jǐn)?shù)據(jù)可以應(yīng)用于哪些項(xiàng)目;還需設(shè)置損失函數(shù)loss、設(shè)定學(xué)習(xí)率,最后進(jìn)行檢驗(yàn)

[免責(zé)聲明]

文章標(biāo)題: 機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)算法

文章內(nèi)容為網(wǎng)站編輯整理發(fā)布,僅供學(xué)習(xí)與參考,不代表本網(wǎng)站贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時溝通。發(fā)送郵件至36dianping@36kr.com,我們會在3個工作日內(nèi)處理。

消息通知
咨詢?nèi)腭v
商務(wù)合作