根據用戶自定義的任務配置,批量而精確地抽取因特網目標網頁中的半結構化與非結構化數據,保存在云數據庫中。
主要功能如下:
智能采集功能:
基于頁面鏈接智能分組打分機制,分析目標采集鏈接
智能識別列表頁有效內容,清除頁面無關信息
基于機器學習技術,采集資訊詳情正文內容、發布日期等多樣化基礎信息
智能適配96%以上網頁詳情頁結構,準確抽取價值內容
便捷配置功能:
在線配置、實時測試、實時反饋
支持翻頁配置、多頁面信息組裝
大多數情況下,無需編程;復雜情況支持在線編程
支持多種頁面節點信息選取方式:css選擇器、xpath選擇器、正則表達式、groovy腳、Jsonpath選擇器、Javascript腳本
采集訂閱功能:
支持全系統數據訂閱
收起
點評