使用ABBYY FlexiCapture來分析和提取工程計劃書中的數據
挑戰
從中文工程設計方案中
提取數據
解決方案
ABBYY FlexiCapture
結果
- 從工程技術文件中自動提取數據
- 1天組建方案
- 1年完成項目
成為世界頂級的清潔能源生產商是中國廣核集團(中廣核,前身為中國廣東核電集團有限公司)的宏偉目標。中廣核成立于1994年,注冊資金為102億元,目前已經發展成為一個受國務院國有資產監督管理委員會(SASAC)監管的主要工業集團。
CGN下轄30多家子公司和研發中心,其中,負責核電工程、施工和管理的中國核電工程有限公司(CNPEC)是其核心機構。自2004年成立以來,它已經成長為行業的中堅力量,其項目包括核電與常規電廠建設、供排水及民用工程承包。
查看如何ABBYY會幫助您
紙質文件限制業務發展
和其他紙張密集型企業一樣,CGN的業務也開始受到堆積如山的文件的限制。公司每年都有大量的計劃書、工程圖紙和建筑設計文件,而且這個數量就像滾雪球一樣越滾越大。管理這樣大量的紙質文件自然會引起諸多問題:
- 文件查找速度慢,而且需要大量人力和資金;
- 文件存儲需要大量資金和空間;
- 可能會由于文件打印稿受損或毀壞導致數據丟失。
CGN自然想到有必要將紙質文件數字化;這樣的解決方案在市場上已經存在。最初,工作人員想到了一種最簡單的方法:手工錄入。但這種方法速度慢,容易出錯,而且需要耗費大量人力。
OCR是一種自動化數據輸入方法,但它不適用于手寫文檔,而且不能選擇性地提取有用數據。 最終,公司找到了基于內置OCR和ICR數據采集技術的智能文檔處理解決方案。這是一種頂尖的現代數據處理解決方案,可以避免全文識別,僅僅提取必要的印刷和手寫數據,也可以給文件分類,并從最復雜的文件布局中極其準確地提取信息。
通過為期四個月的艱苦研究,公司測試和檢測了目前市場上所有廠商提供的技術,并最終選擇了上海泰彼信息技術有限公司提供的基于數據采集技術的戰略性長期解決方案,這種方案兼具大量必要功能,并具備高度的可擴展性和靈活性。
上海泰彼信息技術有限公司專門提供成像、掃描、項目咨詢與發展端到端解決方案,并使用ABBYY技術作為解決方案的核心要素。此外,作為ABBYY的中國合作伙伴,公司長期擁有基于ABBYY技術成功實施項目的專業技能,在中國,這比任何廣告宣傳活動都更有用。
使用ABBYY FlexiCapture來分析和提取工程計劃書中的數據
CGN需要通過一個輸入口來輸入各種類型的大量文件,這些文件大多布局松散,包括含有打印和手寫數據的工程圖紙、計劃書、表格等。通過使用靈活的模板,ABBYY FlexiCapture確保能夠正確地采集這些數據;為此,CGN專門接受了相關培訓。
此外,ABBYY數據采集技術是能夠準確識別漢字的少數技術之一。
整個項目包括以下幾個步驟:
- 用一天時間安裝和設置ABBYY FlexiCapture;對CGN專業人士提供為期三天的培訓,指導他們學會如何創建靈活的模板。
- 對所有計劃書、圖紙等文件進行掃描,并導入到系統之中,這個過程可以全天候無間斷地自動進行,不需要人員值守。
- 系統根據創建的各種模板分析文件自動查找表格,定位所需字段并從中提取數據。
- 為了確保數據100%準確,受過專業培訓的操作員團隊會驗證可疑的識別數據以及原文中的印刷錯誤。
- 最后,將經過提取和驗證以后的數據(文本、表格、工程圖表等)導出至SAP ERP系統,以便進行后續處理和分析。
結果
中國廣核集團是一家大型國有企業。自成立以來,它已積累了數噸紙質文件資料,包括工程設計、圖紙等技術資料。ABBYY的中國合作伙伴是端到端數字化及數據采集解決方案領域的專家,采用ABBYY FlexiCapture來提取文件中的有用信息和可視內容。由于工程計劃書和圖紙通常都布局松散,而且種類各異,這項任務非常艱巨。ABBYY FlexiCapture不僅能很好地支持中文腳本,而且可以根據項目需求輕松地進行定制(包括設計靈活的模板、設置工作流等),因此是理想之選。
項目僅用1年時間,就利用ABBYY FlexiCapture對多年積累下來的全部工程文件進行了數字化處理和加工。公司節省了查閱信息所需的時間,手工錄入和驗證所需的勞力,以及此前物理存儲所浪費的資源。