人臉識(shí)別本身有多種算法可以實(shí)現(xiàn),不同算法的理論基礎(chǔ)也不同,常見(jiàn)的例如人臉識(shí)別產(chǎn)品利用AVS03A圖像處理器;可以對(duì)人臉明暗偵測(cè),自動(dòng)調(diào)整動(dòng)態(tài)曝光補(bǔ)償,人臉追蹤偵測(cè),自動(dòng)調(diào)整影像放大,其中算法運(yùn)用到了“算法MTCNN”。
人臉識(shí)別系統(tǒng)的原理
人臉識(shí)別常用的算法MTCNN的主要框架:
1、Proposal Network (P-Net):
該網(wǎng)絡(luò)結(jié)構(gòu)主要獲得了人臉區(qū)域的候選窗口和邊界框的回歸向量。并用該邊界框做回歸,對(duì)候選窗口進(jìn)行校準(zhǔn),然后通過(guò)非極大值抑制(NMS)來(lái)合并高度重疊的候選框。
2、Refine Network (R-Net):
該網(wǎng)絡(luò)結(jié)構(gòu)還是通過(guò)邊界框回歸和NMS來(lái)去掉那些false-positive區(qū)域。只是由于該網(wǎng)絡(luò)結(jié)構(gòu)和P-Net網(wǎng)絡(luò)結(jié)構(gòu)有差異,多了一個(gè)全連接層,所以會(huì)取得更好的抑制false-positive的作用。
3、Output Network (O-Net):
該層比R-Net層又多了一層卷基層,所以處理的結(jié)果會(huì)更加精細(xì)。作用和R-Net層作用一樣。但是該層對(duì)人臉區(qū)域進(jìn)行了更多的監(jiān)督,同時(shí)還會(huì)輸出5個(gè)地標(biāo)(landmark)。
[免責(zé)聲明]
文章標(biāo)題: 人臉識(shí)別系統(tǒng)的原理
文章內(nèi)容為網(wǎng)站編輯整理發(fā)布,僅供學(xué)習(xí)與參考,不代表本網(wǎng)站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)溝通。發(fā)送郵件至36dianping@36kr.com,我們會(huì)在3個(gè)工作日內(nèi)處理。