油氣大模型新進展:大模型和知識圖譜的雙向奔赴

智通云聯
關注
2024-07-11 16:04
823次閱讀
以ChatGPT為代表的大語言模型主要應用在通用知識領域,具備關聯推理能力強、人工成本低、適配能力強等優點。然而,要將大語言模型應用于垂直行業,還存在準確性(同一問題不同問法的回答不同甚至相反)、黑箱問題(無法得知推理過程和依據)、時效性問題(采用預訓練方式、實時性不高)。
與之對應的,知識圖譜作為知識的結構化表達,具有準確性高、可解釋、擴展性強的優點。大模型和知識圖譜,本質上都是知識的存儲和表達形式,兩者互為補充。 人工智能從通用領域走向垂直行業,需要大模型和知識圖譜的進一步融合。
為了更好推動大模型在油氣領域的應用,智通云聯采用將知識圖譜和大語言模型相結合的技術路徑。采用知識圖譜為大模型提供數據、約束內容范圍,保證回答內容真實可信;利用大語言模型多種衍生模型,提高知識圖譜構建速度、降低人工工作量。
目前,智通云聯油氣大模型正處于技術迭代升級階段:將行業資料、圖譜信息、數據庫數據進行文本化訓練,并提煉圖譜信息、數據庫數據作為語料進行微調訓練,確保回答內容專業性;實際回答時,大模型優先獲取最新信息再做出結合性回答,以保證回答內容時效性。
現階段的智通云聯油氣大模型,可自動學習油氣行業知識、智能識別任務類型,在描述內容中準確識別違規內容、對應法規條目,總結歸納油氣行業知識、編寫提綱性內容。
下一步,智通云聯將聯手石油石化勘探開發研究領域知名研究院,針對油氣上游勘探開發相關業務,充分利用油氣知識庫語料,進行油氣基礎大模型訓練、領域模型微調和強化訓練,在研究類典型場景、生產類典型場景進行試點,探索油氣領域大模型應用落地模式。

智通云聯
+
關注
0