華泰證券攜手云和恩墨,共同組織進行了數據庫服務平臺的典型設計
“ 在金融科技的浪潮下,華泰證券正在以“數字化+平臺化”的思路,全面啟動了數字化轉型,而數據庫作為業務的重要支撐,面臨著爆發式互聯網業務增長帶來的運維壓力。在此背景下,華泰證券攜手云和恩墨,共同組織進行了數據庫服務平臺的典型設計,實現了IT架構的轉型升級。
數字化轉型的挑戰
1
華泰證券股份有限公司是一家領先的科技驅動型綜合證券集團。自1991年成立以來,華泰證券積極把握中國資本市場改革開放的歷史機遇,在業內率先以金融科技助力轉型,并持續加大信息技術投入,積極探索證券行業的未來發展模式。
華泰證券堅定以“數字化+平臺化”的思路,重構業務模式,并已經全面啟動了數字化轉型,用數字化思維和手段徹底改造業務及管理模式。
數據庫作為業務的重要支撐,面臨著爆發式互聯網業務增長帶來的運維壓力,而以前建設的豎井式基礎架構,無疑使數據庫運維變得更加艱難。
? 統一管理難:面對數百套的數據庫系統,缺少統一的數據庫系統臺賬管理中心,無法全面獲取數據庫系統及其關聯硬件資產的生命周期數據。
? 日常運維難:數百套的數據庫系統,每日、每月例行的健康檢查、工作任務繁重。
? 全面監控難:缺乏全方位、細粒度的系統運行狀態監控、告警。
? 故障快速定位難:隨著系統架構復雜性變高,僅僅依托傳統腳本來定位問題,不能滿足證券行業對系統故障定位效率的嚴苛要求。
? 災備演練難:缺少統一的備庫管理中心。定期的災備演練,需要依托大量的腳本、人工操作等方式才能完成,耗時耗力。
數據庫自動化運維方案
2
具有前瞻性的數據庫平臺建設不能只停留在保證業務穩定的階段,而是應該踐行“數字化+平臺化”的雙輪驅動的理念,通過建設統一的數據服務平臺,實現數據庫系統運維的五大必要能力:事前預警能力、健康評估能力、故障快速定位能力、應急響應能力以及深度優化的能力。
在華泰信息科技部門的支持下,云和恩墨與客戶攜手共同組織進行了華泰數據庫服務平臺的典型設計、集中開發和試點推廣。華泰數據庫服務平臺主要實現數據庫建設、管理的自動化,接管華泰環境中所有的Oracle數據庫,實現數據庫系統的部署、運維、備份、監控、優化等平臺級的管理控制。
敏捷迭代,測試先行
3
敏捷迭代
對于華泰證券這樣的大型、重要券商,建設基于數據庫系統的自動化運維服務平臺是一項極其復雜的高難度工作,由于涉及到核心數據庫的管理,所以需要慎之又慎。在經過云和恩墨的專家小組研究討論后,最終與客戶達成共識,即在追求系統功能穩定的大前提下,結合云和恩墨的研發力量和華泰證券的運維支持,采用敏捷開發管理方法,分步提供產品的功能模塊。
用戶故事->需求定義->功能排期->迭代會議->功能開發->功能測試->評審會議->回歸測試->升級補丁->發布更新->升級實施
測試先行
鑒于數據庫服務平臺的重要性,為確保上線的功能穩定可靠,且對生產環境的數據庫不造成任何破壞,我們同時構建了華泰數據平臺的測試環境和生產環境,并先將每次迭代的發布更新,在測試環境上線試運行,在解決了測試環境中試運行出現的所有問題后,根據生產上線計劃, 最終實現了生產環境的穩定上線。
獲得階段性成功,讓運維跑起來
4
在經過了一年的持續迭代和使用磨合,華泰證券數據庫服務平臺達到了階段性的預期:先讓運維跑起來!
目前已上線了的平臺功能包括多租戶管理、災備中心管理、數據庫的表空間/用戶管理、統一的監控告警管理、數據庫部署、DG部署等基礎運維的自動化、智能巡檢自動化和對性能的智能優化分析等等,能夠通過平臺將日常運維的大部分內容搬到線上統一起來。
1、多租戶管理:支持資源隔離,用戶隔離,多租戶共存于一個統一平臺。
2、災備管理平臺化:數據庫測試、災備演練平臺化、自動化。自動化備份恢復,能夠將復雜的備份恢復簡單化,流程化,確保數據安全。
3、數據庫表空間管理平臺化:可以查看近期表空間增長數量和趨勢,并排序列出增長最快的表空間,在線擴容。
4、數據庫用戶管理平臺化:可以在平臺上管理數據庫用戶的創建及角色和權限管理。
5、統一監控和告警:通過數據庫會話、鎖、阻塞樹管理,快速定位問題,并可以一鍵殺會話,形成問題的閉環。
6、基礎運維自動化支持:針對數據庫的基礎運維工作如數據庫部署、高可用環境搭建等,能夠平臺化和自動化。
7、智能巡檢分析:能夠將數據庫重要的巡檢工作,實現自動化,并給出智能化建議。
8、性能分析:自動采集性能數據,分析找出性能瓶頸,進而輔助系統優化工作。
朝著智能化運維邁進
5
華泰證券DBA架構師胡連亞透露,根據數據服務平臺一期建設情況,目前已構建了數據庫全生命周期管理框架,完成了應急響應、故障預警、故障快速定位等關鍵能力的建設。后續將基于全生命周期管理框架,進一步夯實巡檢智能化、服務自治化、健康評估全面化、SQL工作標準化等的運行管理能力,提供自助式數據庫服務,積極賦能DevOps。
“金融企業實現數字化轉型在實現線下業務線上化之后,需要建設數字化運營能力,其中技術運營是重中之重,特別是如何確保以數據庫運維管理為代表的運行保障能力建設對保障金融企業業務連續穩定運行具有重要意義,在本次實現數據庫標準化運維管理的基礎上,華泰將加強對數據高可用管理和運營能力的建設?!?/p>
——華泰證券信息技術部運行保障中心負責人 田江
“一直以來,云和恩墨都秉承「數據驅動,成就客戶」的理念,深入一線與客戶并肩作戰,打造真正滿足用戶需要同時引領行業的 dbPaaS 平臺。感謝華泰證券的信任與支持,讓我們可以一起探索AIOps的智能未來!”
——云和恩墨總經理 蓋國強
此次數據庫自動化運維項目取得階段性成功,更深層次的原因在于華泰證券與云和恩墨建立了深度的關聯和良好的合作關系,并共同探索出了一條屬于券商行業的數字化建設方法,為行業的數字化建設的發展提供了可行性的路徑參考。未來,華泰證券將與云和恩墨繼續攜手共進,探索建設更加智能的數據庫運維平臺。