国产精一区二区_午夜视频99_免费白白视频_中文字幕一区免费

用PS的照片申請理賠,保險公司能過嗎?

AI科技大本營
+ 關注
2022-11-15 16:58
692次閱讀
用PS的照片申請理賠,保險公司能過嗎?
摘要: 保險作為當今風險保障的重要手段,已然成為眾多企業、個人的選擇。作為風險保障的主體,保險公司在承保、理賠等各類業務處理中,都離不開影像資料。影像資料已然成為保險公司大數據浪潮中不容忽視的重要數據要素。如何做好影像資料的自動識別、真假判定等成為保險公司降本增效、風險防范的重要課題。本文就保險行業的影像資料技術和應用給出探討。
作者 |  周咸立  劉平     責編 | 楊陽
出品 | 新程序員 》編輯部
近來,車聯網、云計算、大數據、人工智能、區塊鏈這些新技術將給保險業帶來新一輪變革已成為共識。隨著這些新技術逐漸成熟,行業內對這些技術應用前景既充滿期待又存在擔憂。如何把握這些新技術使其助力公司業務發展,及時掌控新技術引起的商業模式變化,避免企業錯失新技術應用帶來的新商機,這些促使各保險公司在新技術應用上不斷地努力嘗試和創新。
影像資料在保險行業中扮演著重要的角色,尤其在核保、核賠環節,需要查閱并判斷其真實性。例如,對于提供的出險照片檢查是否為PS加工或翻拍的照片。隨著業務的發展,人工審核顯得力不從心,如何控制影像風險,實現降本增效,提升風控能力,是保險公司高質發展中需要新技術來賦能助力的。
面對海量的非結構化影像資料快速檢索與智能識別的需求,傳統的影像處理模式無法滿足當前業務對功能和效率的要求。影像處理的業務內容已不限于文字和少量圖片,而是大量影像資料(包括靜態圖片、音頻、視頻資料等)。在系統功能上,不限于查看圖片,而是要對大量影像資料進行快速檢索、對不符合規范的圖像進行加工處理和識別;在反欺詐上,不限于人工對比查看,而是要對大量影像文件進行相似圖像識別;在系統訪問上,全國的頻繁、大數據量訪問,傳統方式對網絡帶寬需求很高、加上帶寬使用費用高,種種局限與不足亟待解決。
原有影像方案中,著重解決的是海量影像的采集、存儲、傳輸、查看等問題,主要使用大數據和云計算的技術,對于影像本身的深層次處理還有許多不足,不能通過系統高可靠地智能處理以下場景:識別不清晰照片、識別翻拍照片、圖像篡改檢測、相似圖像識別、自動分類等。在當期技術下,人工智能技術的發展使得這些成為現實,同時圖像篡改檢測等AI技術提高了影像本身的可靠性,AI+OCR的智能識別模式也就有了更高的業務價值。
用PS的照片申請理賠,保險公司能過嗎?
影像系統的智能識別應用
如圖1所示,在影像系統中,智能識別主要應用在的幾種服務中:

用PS的照片申請理賠,保險公司能過嗎?

圖1 智能識別在影像中的應用
  • 圖像質量識別: 主要識別圖像是否清晰,是否為翻拍處理圖片。
  • 圖像篡改識別: 檢查圖片是否被局部修改,并標記修改位置。
  • 圖像分類識別: 用于識別圖像類型,例如證件、銀行卡、發票、醫療單據等,根據識別結果完成單證自動分類。
  • 相似影像識別:識別圖像的相似性,在上傳影像文件時,系統對圖像文件進行歸一化處理,提取圖像本身的顏色、形狀、紋理等底層特征,進行相似度計算,將識別結果反饋給影像系統。可以用于車險、農險等核賠、核保環節,對場景過程影像進行自動甄別,智能風險提示,保證影像文件的真實性,及時攔截虛假賠案,提升了風險控制能力,節省人力成本,降低理賠賠付率。
  • OCR服務: 提供對自然場景下的文字、單據、證明、復雜表格及各種混合模式的圖片進行文字識別,可以供周邊系統調用,通常用于輔助錄入、人工雙錄等場景。
  • 合同對比識別: 提供pdf、doc/docx、wps、xls和圖片等主流格式文件對比,支持以全篇幅、整段落的方式進行比對,支持跨頁、跨行的文字比對。
  • 醫療票據識別: 醫療票據的特點就是種類多。醫療票據識別實現對電子病歷的自動標簽標注、智能分類、快速梳理以及復雜電子病歷的半自動閱讀。提供全方位智能風控引擎,實現基于保險產品的過程分控管理,支持高風險案件自動預警的機制。
有了業務需求,考慮應用場景,下一步考察的就是合適的技術支撐。目前影像處理在各主要場景下各有一些可供選擇的技術。
用PS的照片申請理賠,保險公司能過嗎?
圖像清晰度識別(Image Blur Detection)
在影像收集過程中,會出現拍攝物品不清晰,文字模糊的現象,影響業務判斷,對于不清晰的圖像需要及時拒絕上傳。
圖像清晰度評價算法有很多種,在空域中,主要思路是考察圖像的領域對比度,即相鄰像素間的灰度特征的梯度差;在頻域中,主要思路是考察圖像的頻率分量,對焦清晰的圖像高頻分量較多,對焦模糊的圖像低頻分量較多。
實現清晰度評價的3種方法[1]:Tenengrad梯度方法、Laplacian梯度方法和方差方法。
  • Tenengrad梯度方法利用Sobel算子分別計算水平和垂直方向的梯度,同一場景下梯度值越高,圖像越清晰。

  •  Laplacian梯度是另一種求圖像梯度的方法。

  • 方差是概率論中用來考察一組離散數據和其期望(即數據的均值)之間的離散(偏離)程度的度量方法。方差較大,表示這一組數據之間的偏差就較大,組內的數據有的較大,有的較小,分布不均衡;方差較小,表示這一組數據之間的偏差較小,組內的數據之間分布平均,大小相近。對焦清晰的圖像相比對焦模糊的圖像,它的數據之間的灰度差異應該更大,即它的方差應該較大,可以通過圖像灰度數據的方差來衡量圖像的清晰度,方差越大,表示清晰度越好。

用PS的照片申請理賠,保險公司能過嗎?
翻拍檢測:摩爾紋識別(Moire Pattern Recognition)
翻拍圖像是經過掃描、印刷或者其他具有拍攝功能的設備對真實圖像進行翻拍,考慮到對真實圖像進行翻拍的過程中,顯示媒介自身的特性以及翻拍過程的場景區別,使得翻拍圖像與真實圖像存在差異,如翻拍圖像變形等,翻拍圖像表面梯度值與真實圖像相比會產生非線性變化,這使翻拍圖像表面梯度值產生異常,進而導致翻拍圖像中存在的初始直線分布發生變化。因此,提取邊緣圖像中的初始直線,以便后續在初始直線提取更加準確翻拍像素特征。
翻拍檢測實現方法
  • 邊緣檢測。邊緣檢測本質上就是一種濾波算法,區別在于濾波器的選擇,濾波的規則是完全一致的。基本的邊緣算子如Sobel求得的邊緣圖存在很多問題,如噪聲污染沒有被排除、邊緣線太過于粗寬等。比較先進的邊緣檢測算子包括Canny算子、Marr-Hildreth算子等。
  • 通過直線檢測算法對邊緣圖像進行直線提取,得到初始直線(直線檢測算法包括Hough(霍夫變換)直線檢測算法、Freeman(鏈碼)直線檢測算法或者尺蠖蠕行算法)。
  • 提取翻拍直線。翻拍直線是指滿足直線密集算法判別準則的直線,即直線密集集中且平行,該判別準則包括兩條直線的斜率差值小于1°(度),且相鄰的平行的兩條直線的距離小于預設的距離閾值。直線密集算法中,初始直線需要滿足“平行”和“密集集中”這兩個條件。對于“平行”這一條件,即兩條初始直線的斜率值寫入初始直線像素點后,如果斜率差值小于1°(度),則初始直線平行,即滿足“平行”的條件。對于“密集集中”這一條件,即計算兩條平行直線(初始直線)之間的距離,將滿足該距離小于預設的距離閾值的兩條直線確定為滿足“密集集中”這一條件,也即翻拍直線。
用PS的照片申請理賠,保險公司能過嗎?
目標檢測(Object Detection)
在 計 算 機 視 覺 技 術 領 域中,目標 檢 測(Object Detection)是一項非常基礎的技術,圖像分割、物體追蹤、關鍵點檢測等都依賴目標檢測。
使用TensorFlow構建YOLO V3目標檢測模型[3],相比RCNN構建的自動分類模型,不僅能識別出圖像上的多個分類以及更高的準確率,而且能定位分類對應的位置。YOLO V3模型相比其他模型識別速度更快。它在 Pascal Titan X顯卡上處理COCO test-dev數據集的圖片,速度能達到30 FPS, mAP可達57.9% 。如圖2所示,YOLOv3的檢測速度非常快,比R-CNN快1000倍,比Fast R-CNN快100倍。在 IoU=0.5的情況下,其mAP值與Focal Loss相當,但檢測速度快了4倍。此外,你可以根據你的需要,在只需改變模型的大小而不需要進行重新訓練的情況下,就可以輕松地權衡檢測速度和準確度。
用PS的照片申請理賠,保險公司能過嗎?
圖2 YOLOv3與其他目標檢測算法效率對比
即使圖片的拍攝質量低、拍攝的角度不同,依然可以準確地識別相應的類別以及對應的位置。
用PS的照片申請理賠,保險公司能過嗎?
基于內容的圖像檢索(Content-Based Image Retrieval)
基于內容的圖像檢索,即CBIR(Content-based image retrieval)[4],是計算機視覺領域中關注大規模數字圖像內容檢索的研究分支。如圖3所示,影像檢索系統的圖像識別功能主要基于CBIR原理,在上傳影像文件時,系統對圖像文件進行歸一化處理,提取圖像本身的顏色、形狀、紋理等底層特征,從圖像視覺特征出發,在圖像大數據庫中通過搜索引擎找出與之匹配的圖像,并根據檢索結果進行相似度計算。

用PS的照片申請理賠,保險公司能過嗎?

圖3 CBIR識別原理
利用CBIR技術識別圖像的真實性,識別內容主要包括:
  • 識別圖片是否被重復使用。
  • 識別圖片是否被PS后重復使用。
  • 上傳照片是否為翻拍或裁切圖片。
  • 同一批事故車照片是否被使用在不同批次的理賠案件中 。
  • 農險的驗標圖片是否存在使用相同標的分批拍攝的情況。
如圖4所示,二次理賠時,將圖片進行PS處理,然后進行理賠申請,通過圖像內容檢索技術,可以找到原始圖片,并標記差異部位。
用PS的照片申請理賠,保險公司能過嗎?
圖4 CBIR識別結果與原圖對比
在影像系統中存在一些銀行卡、客戶身份證件、紙質文件的電子掃描件等圖像,而這些類型的圖像在多個業務中允許重復出現且該類型文件本身相似度極高,通常不需要進行影像重復使用識別。針對這些類型的影像和應用場景,通過圖像主體檢測技術,辨識圖像是否需要排除識別,從而提高圖像內容檢索的精準度和效率,確保檢索識別的精準度可達到96%以上。
用PS的照片申請理賠,保險公司能過嗎?
向量搜索(Vector Search)
如圖5所示,相似圖像檢索本質是向量檢索技術,影像存儲的非結構化數據通過人工智能算法,將數據進行抽象處理,變成多維的向量[5]。這些向量如同數學空間中的坐標,標識著各個實體和實體關系,通過向量搜索,從而找到對應的實體。
用PS的照片申請理賠,保險公司能過嗎?
圖5 向量檢索技術實現過程
向量搜索主要的應用領域如人臉識別、推薦系統、圖片搜索、視頻指紋、語音處理、自然語言處理、文件搜索等。
隨著AI技術的廣泛應用,以及數據規模的不斷增長,向量檢索也逐漸成了AI技術鏈路中不可或缺的一環,更是對傳統搜索技術的補充,并且具備多模態搜索的能力。
用PS的照片申請理賠,保險公司能過嗎?
圖像篡改檢測(Image Manipulation Detection)
近年來數字媒體已經成為我們日常生活的一部分,數字媒體內容真偽鑒別的重要性日漸凸顯。論文Image Manipulation Detection by Multi-View Multi-Scale Supervision[6]提出了一種新的基于多視角(multi-view)、多尺度 (multi-scale)監督的圖像篡改檢測模型MVSS Net,可通過檢查照片像素、光線、紋理來判斷照片是否被修改過。
通常將容易造成視覺誤解的圖像篡改劃分為Copy-move(在同一張圖內,復制并移動某一區域), Splicing(從一個圖像復制區域到另一圖像)和 Inpainting(刪除圖片內不必要的元素)三種類型, MVSS-Net的目標是自動檢測這些類型的操作圖像,區分出真實和被篡改圖像,并且在像素水平上精確地定位被篡改的區域。
MVSS-Net 首次結合了篡改區域的邊界特征和噪聲特征以學習泛化性更強的語義無關特征,并使用多尺度監督方式提高對篡改區域的敏感度和對真圖的特異度MVSS-Net 在 DEFACTO 數據集上進行了消融實驗,在 CASIA,COVERAGE , COLUMBIA ,NIST16和DEFACTO五個公開數據集上進行了實驗驗證。如圖6所示,給出 MVSS-Net 和 SOTA方法在公開數據集上的部分檢測結果,前三行依次為:copy-move,splicing,inpainting三類篡改,后三行為真實圖片,MVSS-Net在真實圖片和篡改圖片間取得了好的平衡。實驗表明,MVSS-Net在圖像級和像素級均達到了state-of-the-art,在獲得對篡改區域高精度定位的同時兼顧了對真圖更少的誤判,是貼合實際應用需求的圖像篡改檢測方法。
用PS的照片申請理賠,保險公司能過嗎?
圖6 MVSS-Net和SOTA模型在公共數據集中的部分結果
用PS的照片申請理賠,保險公司能過嗎?
AI-OCR智能識別
傳統的OCR已經能夠提供精準的文字檢測和識別服務,但是其基礎是建立在圖像本身的可靠上。通過上面介紹的相關技術,AI能夠幫助進行翻拍檢測、圖像篡改檢測等,提高了圖像本身的可靠性。
AI-OCR智能識別系統采用模型遷移、對抗網絡數據生成和FSL技術,結合自身海量的圖像資料、標注數據和硬件GPU高性能的運算,搭建深度學習全流程的技術框架閉環,并構建出完整的OCR識別結果方案。包括對各類常規證件信息,例如:身份證、銀行卡、行駛證、護照、營業執照、增值稅發票、車輛合格證等;非常規證件,例如:銀行卡的行內票據、保險業的保單、合同、理賠申請書等的全文本信息識別輸出和結構化,簡化業務流程,提升工作效率以實現商業化價值最大化。
目前的應用場景主要集中在四十種常用證件類型、各類票據、各類表單文檔等模塊的識別,整體字符識別率在99%以上,在醫療票據識別和合同對比識別中應用廣泛。
醫療票據識別
通過醫學自然語言處理、文本挖掘、醫學信息詞庫,實現了對電子病歷的自動標簽標注、智能分類、快速梳理等技術,實現對復雜電子病歷的半自動閱讀。并且實現了多項醫學信息評估算法和技術,建立了專業的醫學知識圖片,能夠對體檢報告等數據進行單病種預測及中和醫學數據評估。
業務人員在影像系統采集和分揀醫療票據后把影像文件送給AI-OCR識別系統進行識別、單證分揀和單證脫敏,然后在數據清洗模塊對數據進行處理和清洗,最后輸出由標準編碼確定的、經過清洗的信息和做了對應關系的別名和標準名。
合同對比識別
合同一般使用制式合同,為了防止合同被另一方修改或者篡改,制式合同的出具方需要對合同的全部文字條款審核確認,為此就需要法務人員多次審閱,人工審核合同耗時長,不僅準確率無法保證,而且風險還高,合同智能比對系統可為企業提供有效的技術支撐和安全保障。
合同比對基于OCR智能識別技術,將定稿合同和用印前(或單方用印)的合同進行文字級別的自動比對,實現計算機替代人工審核比對,解決合同審核工作中人工審核時間成本高、人力成本高和風險高三大難題。
用PS的照片申請理賠,保險公司能過嗎?
結語
數據處理鏈路“采”“存”“通”的目的都是為了“用”,有了業務需求和技術支撐,提升“用”的水平就是水到渠成的事。從智能理賠的實踐來看,如何發掘數據的價值,目前主要還是依靠人工智能技術。圖像清晰度識別,能夠從源頭上對圖像質量提出要求,避免干擾業務的判斷;翻拍檢測和圖像篡改檢測技術,能夠及時發現細節的證據,減少騙賠的發生;目標檢測技術,有利于進行影像的自動歸類;基于內容的圖像檢索和向量搜索技術,有利于發現重復賠案。基于以上AI技術能夠有效提高影像本身的可靠性,在可靠的影像上進行OCR得到的結果更有業務價值。
此外,技術的提升帶來了新的改變,影響的不僅是技術本身直接解決的問題(如圖像篡改識別),也能帶動其他現有技術的深入應用(AI+OCR等)。
作者介紹

用PS的照片申請理賠,保險公司能過嗎?

周咸立,中科軟科技股份有限公司技術架構團隊負責人、資深架構師。持續專注于當期IT技術在保險行業的落地應用,在分布式處理、多云架構、影像處理、智能應用等方面有深刻的理解。目前致力于多云平臺下技術資源的整合和應用。

用PS的照片申請理賠,保險公司能過嗎?

劉平,中科軟科技股份有限公司 影像產品團隊負責人、資深架構師。在大數據、分布式系統、人工智能和向量搜索方面有深入研究,目前致力于使用AI、大數據等技術,構建保險行業的圖像數據庫,全面挖掘影像數據價值。
參考資料:
[1]OpenCV 圖像清晰度評價 https://blog.csdn.net/
dcrmg/article/details/53543341
[2]Gnuey lup:論文和專利筆記:翻拍檢測算法https://
zhuanlan.zhihu.com/p/80381412
[3]Joseph Redmon, Ali Farhadi University of
Washington,YOLOv3: An Incremental Improvement
https://pjreddie.com/media/fifiles/papers/YOLOv3.pdf
[4]Shiv Ram Dubey: A Decade Survey of Content
Based Image Retrieval using Deep Learning
[5]達摩院|達摩院自研向量檢索引擎 Proxima 公開https://
developer.aliyun.com/article/783110
[6]Xinru Chen, Chengbo Dong, Jiaqi Ji, Juan Cao,
Xirong Li:Image Manipulation Detection by Multi
View Multi-Scale Supervision https://arxiv.org/
abs/2104.06832

本文來自微信公眾號“AI科技大本營”(ID:rgznai100),作者:周咸立  劉平,36氪經授權發布。

0
相關文章
最新文章
查看更多
關注 36氪企服點評 公眾號
打開微信掃一掃
為您推送企服點評最新內容
消息通知
咨詢入駐
商務合作