国产精一区二区_午夜视频99_免费白白视频_中文字幕一区免费

用PS的照片申請理賠,保險公司能過嗎?

AI科技大本營
+ 關注
2022-11-15 16:58
711次閱讀
用PS的照片申請理賠,保險公司能過嗎?
摘要: 保險作為當今風險保障的重要手段,已然成為眾多企業(yè)、個人的選擇。作為風險保障的主體,保險公司在承保、理賠等各類業(yè)務處理中,都離不開影像資料。影像資料已然成為保險公司大數(shù)據(jù)浪潮中不容忽視的重要數(shù)據(jù)要素。如何做好影像資料的自動識別、真假判定等成為保險公司降本增效、風險防范的重要課題。本文就保險行業(yè)的影像資料技術和應用給出探討。
作者 |  周咸立  劉平     責編 | 楊陽
出品 | 新程序員 》編輯部
近來,車聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、人工智能、區(qū)塊鏈這些新技術將給保險業(yè)帶來新一輪變革已成為共識。隨著這些新技術逐漸成熟,行業(yè)內對這些技術應用前景既充滿期待又存在擔憂。如何把握這些新技術使其助力公司業(yè)務發(fā)展,及時掌控新技術引起的商業(yè)模式變化,避免企業(yè)錯失新技術應用帶來的新商機,這些促使各保險公司在新技術應用上不斷地努力嘗試和創(chuàng)新。
影像資料在保險行業(yè)中扮演著重要的角色,尤其在核保、核賠環(huán)節(jié),需要查閱并判斷其真實性。例如,對于提供的出險照片檢查是否為PS加工或翻拍的照片。隨著業(yè)務的發(fā)展,人工審核顯得力不從心,如何控制影像風險,實現(xiàn)降本增效,提升風控能力,是保險公司高質發(fā)展中需要新技術來賦能助力的。
面對海量的非結構化影像資料快速檢索與智能識別的需求,傳統(tǒng)的影像處理模式無法滿足當前業(yè)務對功能和效率的要求。影像處理的業(yè)務內容已不限于文字和少量圖片,而是大量影像資料(包括靜態(tài)圖片、音頻、視頻資料等)。在系統(tǒng)功能上,不限于查看圖片,而是要對大量影像資料進行快速檢索、對不符合規(guī)范的圖像進行加工處理和識別;在反欺詐上,不限于人工對比查看,而是要對大量影像文件進行相似圖像識別;在系統(tǒng)訪問上,全國的頻繁、大數(shù)據(jù)量訪問,傳統(tǒng)方式對網(wǎng)絡帶寬需求很高、加上帶寬使用費用高,種種局限與不足亟待解決。
原有影像方案中,著重解決的是海量影像的采集、存儲、傳輸、查看等問題,主要使用大數(shù)據(jù)和云計算的技術,對于影像本身的深層次處理還有許多不足,不能通過系統(tǒng)高可靠地智能處理以下場景:識別不清晰照片、識別翻拍照片、圖像篡改檢測、相似圖像識別、自動分類等。在當期技術下,人工智能技術的發(fā)展使得這些成為現(xiàn)實,同時圖像篡改檢測等AI技術提高了影像本身的可靠性,AI+OCR的智能識別模式也就有了更高的業(yè)務價值。
用PS的照片申請理賠,保險公司能過嗎?
影像系統(tǒng)的智能識別應用
如圖1所示,在影像系統(tǒng)中,智能識別主要應用在的幾種服務中:

用PS的照片申請理賠,保險公司能過嗎?

圖1 智能識別在影像中的應用
  • 圖像質量識別: 主要識別圖像是否清晰,是否為翻拍處理圖片。
  • 圖像篡改識別: 檢查圖片是否被局部修改,并標記修改位置。
  • 圖像分類識別: 用于識別圖像類型,例如證件、銀行卡、發(fā)票、醫(yī)療單據(jù)等,根據(jù)識別結果完成單證自動分類。
  • 相似影像識別:識別圖像的相似性,在上傳影像文件時,系統(tǒng)對圖像文件進行歸一化處理,提取圖像本身的顏色、形狀、紋理等底層特征,進行相似度計算,將識別結果反饋給影像系統(tǒng)。可以用于車險、農(nóng)險等核賠、核保環(huán)節(jié),對場景過程影像進行自動甄別,智能風險提示,保證影像文件的真實性,及時攔截虛假賠案,提升了風險控制能力,節(jié)省人力成本,降低理賠賠付率。
  • OCR服務: 提供對自然場景下的文字、單據(jù)、證明、復雜表格及各種混合模式的圖片進行文字識別,可以供周邊系統(tǒng)調用,通常用于輔助錄入、人工雙錄等場景。
  • 合同對比識別: 提供pdf、doc/docx、wps、xls和圖片等主流格式文件對比,支持以全篇幅、整段落的方式進行比對,支持跨頁、跨行的文字比對。
  • 醫(yī)療票據(jù)識別: 醫(yī)療票據(jù)的特點就是種類多。醫(yī)療票據(jù)識別實現(xiàn)對電子病歷的自動標簽標注、智能分類、快速梳理以及復雜電子病歷的半自動閱讀。提供全方位智能風控引擎,實現(xiàn)基于保險產(chǎn)品的過程分控管理,支持高風險案件自動預警的機制。
有了業(yè)務需求,考慮應用場景,下一步考察的就是合適的技術支撐。目前影像處理在各主要場景下各有一些可供選擇的技術。
用PS的照片申請理賠,保險公司能過嗎?
圖像清晰度識別(Image Blur Detection)
在影像收集過程中,會出現(xiàn)拍攝物品不清晰,文字模糊的現(xiàn)象,影響業(yè)務判斷,對于不清晰的圖像需要及時拒絕上傳。
圖像清晰度評價算法有很多種,在空域中,主要思路是考察圖像的領域對比度,即相鄰像素間的灰度特征的梯度差;在頻域中,主要思路是考察圖像的頻率分量,對焦清晰的圖像高頻分量較多,對焦模糊的圖像低頻分量較多。
實現(xiàn)清晰度評價的3種方法[1]:Tenengrad梯度方法、Laplacian梯度方法和方差方法。
  • Tenengrad梯度方法利用Sobel算子分別計算水平和垂直方向的梯度,同一場景下梯度值越高,圖像越清晰。

  •  Laplacian梯度是另一種求圖像梯度的方法。

  • 方差是概率論中用來考察一組離散數(shù)據(jù)和其期望(即數(shù)據(jù)的均值)之間的離散(偏離)程度的度量方法。方差較大,表示這一組數(shù)據(jù)之間的偏差就較大,組內的數(shù)據(jù)有的較大,有的較小,分布不均衡;方差較小,表示這一組數(shù)據(jù)之間的偏差較小,組內的數(shù)據(jù)之間分布平均,大小相近。對焦清晰的圖像相比對焦模糊的圖像,它的數(shù)據(jù)之間的灰度差異應該更大,即它的方差應該較大,可以通過圖像灰度數(shù)據(jù)的方差來衡量圖像的清晰度,方差越大,表示清晰度越好。

用PS的照片申請理賠,保險公司能過嗎?
翻拍檢測:摩爾紋識別(Moire Pattern Recognition)
翻拍圖像是經(jīng)過掃描、印刷或者其他具有拍攝功能的設備對真實圖像進行翻拍,考慮到對真實圖像進行翻拍的過程中,顯示媒介自身的特性以及翻拍過程的場景區(qū)別,使得翻拍圖像與真實圖像存在差異,如翻拍圖像變形等,翻拍圖像表面梯度值與真實圖像相比會產(chǎn)生非線性變化,這使翻拍圖像表面梯度值產(chǎn)生異常,進而導致翻拍圖像中存在的初始直線分布發(fā)生變化。因此,提取邊緣圖像中的初始直線,以便后續(xù)在初始直線提取更加準確翻拍像素特征。
翻拍檢測實現(xiàn)方法
  • 邊緣檢測。邊緣檢測本質上就是一種濾波算法,區(qū)別在于濾波器的選擇,濾波的規(guī)則是完全一致的。基本的邊緣算子如Sobel求得的邊緣圖存在很多問題,如噪聲污染沒有被排除、邊緣線太過于粗寬等。比較先進的邊緣檢測算子包括Canny算子、Marr-Hildreth算子等。
  • 通過直線檢測算法對邊緣圖像進行直線提取,得到初始直線(直線檢測算法包括Hough(霍夫變換)直線檢測算法、Freeman(鏈碼)直線檢測算法或者尺蠖蠕行算法)。
  • 提取翻拍直線。翻拍直線是指滿足直線密集算法判別準則的直線,即直線密集集中且平行,該判別準則包括兩條直線的斜率差值小于1°(度),且相鄰的平行的兩條直線的距離小于預設的距離閾值。直線密集算法中,初始直線需要滿足“平行”和“密集集中”這兩個條件。對于“平行”這一條件,即兩條初始直線的斜率值寫入初始直線像素點后,如果斜率差值小于1°(度),則初始直線平行,即滿足“平行”的條件。對于“密集集中”這一條件,即計算兩條平行直線(初始直線)之間的距離,將滿足該距離小于預設的距離閾值的兩條直線確定為滿足“密集集中”這一條件,也即翻拍直線。
用PS的照片申請理賠,保險公司能過嗎?
目標檢測(Object Detection)
在 計 算 機 視 覺 技 術 領 域中,目標 檢 測(Object Detection)是一項非常基礎的技術,圖像分割、物體追蹤、關鍵點檢測等都依賴目標檢測。
使用TensorFlow構建YOLO V3目標檢測模型[3],相比RCNN構建的自動分類模型,不僅能識別出圖像上的多個分類以及更高的準確率,而且能定位分類對應的位置。YOLO V3模型相比其他模型識別速度更快。它在 Pascal Titan X顯卡上處理COCO test-dev數(shù)據(jù)集的圖片,速度能達到30 FPS, mAP可達57.9% 。如圖2所示,YOLOv3的檢測速度非常快,比R-CNN快1000倍,比Fast R-CNN快100倍。在 IoU=0.5的情況下,其mAP值與Focal Loss相當,但檢測速度快了4倍。此外,你可以根據(jù)你的需要,在只需改變模型的大小而不需要進行重新訓練的情況下,就可以輕松地權衡檢測速度和準確度。
用PS的照片申請理賠,保險公司能過嗎?
圖2 YOLOv3與其他目標檢測算法效率對比
即使圖片的拍攝質量低、拍攝的角度不同,依然可以準確地識別相應的類別以及對應的位置。
用PS的照片申請理賠,保險公司能過嗎?
基于內容的圖像檢索(Content-Based Image Retrieval)
基于內容的圖像檢索,即CBIR(Content-based image retrieval)[4],是計算機視覺領域中關注大規(guī)模數(shù)字圖像內容檢索的研究分支。如圖3所示,影像檢索系統(tǒng)的圖像識別功能主要基于CBIR原理,在上傳影像文件時,系統(tǒng)對圖像文件進行歸一化處理,提取圖像本身的顏色、形狀、紋理等底層特征,從圖像視覺特征出發(fā),在圖像大數(shù)據(jù)庫中通過搜索引擎找出與之匹配的圖像,并根據(jù)檢索結果進行相似度計算。

用PS的照片申請理賠,保險公司能過嗎?

圖3 CBIR識別原理
利用CBIR技術識別圖像的真實性,識別內容主要包括:
  • 識別圖片是否被重復使用。
  • 識別圖片是否被PS后重復使用。
  • 上傳照片是否為翻拍或裁切圖片。
  • 同一批事故車照片是否被使用在不同批次的理賠案件中 。
  • 農(nóng)險的驗標圖片是否存在使用相同標的分批拍攝的情況。
如圖4所示,二次理賠時,將圖片進行PS處理,然后進行理賠申請,通過圖像內容檢索技術,可以找到原始圖片,并標記差異部位。
用PS的照片申請理賠,保險公司能過嗎?
圖4 CBIR識別結果與原圖對比
在影像系統(tǒng)中存在一些銀行卡、客戶身份證件、紙質文件的電子掃描件等圖像,而這些類型的圖像在多個業(yè)務中允許重復出現(xiàn)且該類型文件本身相似度極高,通常不需要進行影像重復使用識別。針對這些類型的影像和應用場景,通過圖像主體檢測技術,辨識圖像是否需要排除識別,從而提高圖像內容檢索的精準度和效率,確保檢索識別的精準度可達到96%以上。
用PS的照片申請理賠,保險公司能過嗎?
向量搜索(Vector Search)
如圖5所示,相似圖像檢索本質是向量檢索技術,影像存儲的非結構化數(shù)據(jù)通過人工智能算法,將數(shù)據(jù)進行抽象處理,變成多維的向量[5]。這些向量如同數(shù)學空間中的坐標,標識著各個實體和實體關系,通過向量搜索,從而找到對應的實體。
用PS的照片申請理賠,保險公司能過嗎?
圖5 向量檢索技術實現(xiàn)過程
向量搜索主要的應用領域如人臉識別、推薦系統(tǒng)、圖片搜索、視頻指紋、語音處理、自然語言處理、文件搜索等。
隨著AI技術的廣泛應用,以及數(shù)據(jù)規(guī)模的不斷增長,向量檢索也逐漸成了AI技術鏈路中不可或缺的一環(huán),更是對傳統(tǒng)搜索技術的補充,并且具備多模態(tài)搜索的能力。
用PS的照片申請理賠,保險公司能過嗎?
圖像篡改檢測(Image Manipulation Detection)
近年來數(shù)字媒體已經(jīng)成為我們日常生活的一部分,數(shù)字媒體內容真?zhèn)舞b別的重要性日漸凸顯。論文Image Manipulation Detection by Multi-View Multi-Scale Supervision[6]提出了一種新的基于多視角(multi-view)、多尺度 (multi-scale)監(jiān)督的圖像篡改檢測模型MVSS Net,可通過檢查照片像素、光線、紋理來判斷照片是否被修改過。
通常將容易造成視覺誤解的圖像篡改劃分為Copy-move(在同一張圖內,復制并移動某一區(qū)域), Splicing(從一個圖像復制區(qū)域到另一圖像)和 Inpainting(刪除圖片內不必要的元素)三種類型, MVSS-Net的目標是自動檢測這些類型的操作圖像,區(qū)分出真實和被篡改圖像,并且在像素水平上精確地定位被篡改的區(qū)域。
MVSS-Net 首次結合了篡改區(qū)域的邊界特征和噪聲特征以學習泛化性更強的語義無關特征,并使用多尺度監(jiān)督方式提高對篡改區(qū)域的敏感度和對真圖的特異度MVSS-Net 在 DEFACTO 數(shù)據(jù)集上進行了消融實驗,在 CASIA,COVERAGE , COLUMBIA ,NIST16和DEFACTO五個公開數(shù)據(jù)集上進行了實驗驗證。如圖6所示,給出 MVSS-Net 和 SOTA方法在公開數(shù)據(jù)集上的部分檢測結果,前三行依次為:copy-move,splicing,inpainting三類篡改,后三行為真實圖片,MVSS-Net在真實圖片和篡改圖片間取得了好的平衡。實驗表明,MVSS-Net在圖像級和像素級均達到了state-of-the-art,在獲得對篡改區(qū)域高精度定位的同時兼顧了對真圖更少的誤判,是貼合實際應用需求的圖像篡改檢測方法。
用PS的照片申請理賠,保險公司能過嗎?
圖6 MVSS-Net和SOTA模型在公共數(shù)據(jù)集中的部分結果
用PS的照片申請理賠,保險公司能過嗎?
AI-OCR智能識別
傳統(tǒng)的OCR已經(jīng)能夠提供精準的文字檢測和識別服務,但是其基礎是建立在圖像本身的可靠上。通過上面介紹的相關技術,AI能夠幫助進行翻拍檢測、圖像篡改檢測等,提高了圖像本身的可靠性。
AI-OCR智能識別系統(tǒng)采用模型遷移、對抗網(wǎng)絡數(shù)據(jù)生成和FSL技術,結合自身海量的圖像資料、標注數(shù)據(jù)和硬件GPU高性能的運算,搭建深度學習全流程的技術框架閉環(huán),并構建出完整的OCR識別結果方案。包括對各類常規(guī)證件信息,例如:身份證、銀行卡、行駛證、護照、營業(yè)執(zhí)照、增值稅發(fā)票、車輛合格證等;非常規(guī)證件,例如:銀行卡的行內票據(jù)、保險業(yè)的保單、合同、理賠申請書等的全文本信息識別輸出和結構化,簡化業(yè)務流程,提升工作效率以實現(xiàn)商業(yè)化價值最大化。
目前的應用場景主要集中在四十種常用證件類型、各類票據(jù)、各類表單文檔等模塊的識別,整體字符識別率在99%以上,在醫(yī)療票據(jù)識別和合同對比識別中應用廣泛。
醫(yī)療票據(jù)識別
通過醫(yī)學自然語言處理、文本挖掘、醫(yī)學信息詞庫,實現(xiàn)了對電子病歷的自動標簽標注、智能分類、快速梳理等技術,實現(xiàn)對復雜電子病歷的半自動閱讀。并且實現(xiàn)了多項醫(yī)學信息評估算法和技術,建立了專業(yè)的醫(yī)學知識圖片,能夠對體檢報告等數(shù)據(jù)進行單病種預測及中和醫(yī)學數(shù)據(jù)評估。
業(yè)務人員在影像系統(tǒng)采集和分揀醫(yī)療票據(jù)后把影像文件送給AI-OCR識別系統(tǒng)進行識別、單證分揀和單證脫敏,然后在數(shù)據(jù)清洗模塊對數(shù)據(jù)進行處理和清洗,最后輸出由標準編碼確定的、經(jīng)過清洗的信息和做了對應關系的別名和標準名。
合同對比識別
合同一般使用制式合同,為了防止合同被另一方修改或者篡改,制式合同的出具方需要對合同的全部文字條款審核確認,為此就需要法務人員多次審閱,人工審核合同耗時長,不僅準確率無法保證,而且風險還高,合同智能比對系統(tǒng)可為企業(yè)提供有效的技術支撐和安全保障。
合同比對基于OCR智能識別技術,將定稿合同和用印前(或單方用印)的合同進行文字級別的自動比對,實現(xiàn)計算機替代人工審核比對,解決合同審核工作中人工審核時間成本高、人力成本高和風險高三大難題。
用PS的照片申請理賠,保險公司能過嗎?
結語
數(shù)據(jù)處理鏈路“采”“存”“通”的目的都是為了“用”,有了業(yè)務需求和技術支撐,提升“用”的水平就是水到渠成的事。從智能理賠的實踐來看,如何發(fā)掘數(shù)據(jù)的價值,目前主要還是依靠人工智能技術。圖像清晰度識別,能夠從源頭上對圖像質量提出要求,避免干擾業(yè)務的判斷;翻拍檢測和圖像篡改檢測技術,能夠及時發(fā)現(xiàn)細節(jié)的證據(jù),減少騙賠的發(fā)生;目標檢測技術,有利于進行影像的自動歸類;基于內容的圖像檢索和向量搜索技術,有利于發(fā)現(xiàn)重復賠案。基于以上AI技術能夠有效提高影像本身的可靠性,在可靠的影像上進行OCR得到的結果更有業(yè)務價值。
此外,技術的提升帶來了新的改變,影響的不僅是技術本身直接解決的問題(如圖像篡改識別),也能帶動其他現(xiàn)有技術的深入應用(AI+OCR等)。
作者介紹

用PS的照片申請理賠,保險公司能過嗎?

周咸立,中科軟科技股份有限公司技術架構團隊負責人、資深架構師。持續(xù)專注于當期IT技術在保險行業(yè)的落地應用,在分布式處理、多云架構、影像處理、智能應用等方面有深刻的理解。目前致力于多云平臺下技術資源的整合和應用。

用PS的照片申請理賠,保險公司能過嗎?

劉平,中科軟科技股份有限公司 影像產(chǎn)品團隊負責人、資深架構師。在大數(shù)據(jù)、分布式系統(tǒng)、人工智能和向量搜索方面有深入研究,目前致力于使用AI、大數(shù)據(jù)等技術,構建保險行業(yè)的圖像數(shù)據(jù)庫,全面挖掘影像數(shù)據(jù)價值。
參考資料:
[1]OpenCV 圖像清晰度評價 https://blog.csdn.net/
dcrmg/article/details/53543341
[2]Gnuey lup:論文和專利筆記:翻拍檢測算法https://
zhuanlan.zhihu.com/p/80381412
[3]Joseph Redmon, Ali Farhadi University of
Washington,YOLOv3: An Incremental Improvement
https://pjreddie.com/media/fifiles/papers/YOLOv3.pdf
[4]Shiv Ram Dubey: A Decade Survey of Content
Based Image Retrieval using Deep Learning
[5]達摩院|達摩院自研向量檢索引擎 Proxima 公開https://
developer.aliyun.com/article/783110
[6]Xinru Chen, Chengbo Dong, Jiaqi Ji, Juan Cao,
Xirong Li:Image Manipulation Detection by Multi
View Multi-Scale Supervision https://arxiv.org/
abs/2104.06832

本文來自微信公眾號“AI科技大本營”(ID:rgznai100),作者:周咸立  劉平,36氪經(jīng)授權發(fā)布。

0
相關文章
最新文章
查看更多
關注 36氪企服點評 公眾號
打開微信掃一掃
為您推送企服點評最新內容
消息通知
咨詢入駐
商務合作