日志是系統(tǒng)生成的數(shù)據(jù),用于記錄系統(tǒng)狀態(tài)、性能和連接性。當(dāng)公司使用特定的 IT 系統(tǒng)時(shí),他們想知道它是否可以運(yùn)行。日志可以記錄系統(tǒng)中發(fā)生的所有事情,并顯示它出了什么問題。
IT 管理員和開發(fā)人員跟蹤服務(wù)級(jí)別協(xié)議、監(jiān)控系統(tǒng)性能并識(shí)別日志問題。公司使用日志監(jiān)控軟件來收集和監(jiān)控服務(wù)器、應(yīng)用程序和網(wǎng)絡(luò)生成的文件。這會(huì)檢測(cè)系統(tǒng)中的異常,以便 IT 團(tuán)隊(duì)可以修復(fù)它們,而不是等待異常變成錯(cuò)誤。
公司還使用日志分析軟件存儲(chǔ)日志,因此也可以分析歷史數(shù)據(jù)以預(yù)測(cè)未來模式。
什么是日志?
日志類型
不同的系統(tǒng)和設(shè)備會(huì)生成不同的日志。以下是公司跟蹤的最常見的日志類型:
- 應(yīng)用程序日志:每個(gè)業(yè)務(wù)應(yīng)用程序(例如 Web 服務(wù)器、電子郵件、數(shù)據(jù)庫和進(jìn)行中的應(yīng)用程序)都會(huì)生成日志以顯示資源利用率和響應(yīng)時(shí)間。如果在文件中發(fā)現(xiàn)問題,IT 團(tuán)隊(duì)可以調(diào)試內(nèi)部應(yīng)用程序或?qū)①Y源分配給第三方應(yīng)用程序。
- 網(wǎng)絡(luò)日志:路由器、交換機(jī)和所有網(wǎng)絡(luò)硬件日志通知管理員網(wǎng)絡(luò)可用性和連接性。IT 管理員將在網(wǎng)絡(luò)資源異常發(fā)展為可能減慢網(wǎng)絡(luò)速度的網(wǎng)絡(luò)問題之前收到警報(bào)。
- 端點(diǎn)日志:連接的工作站、筆記本電腦、臺(tái)式機(jī)、手機(jī)日志顯示用戶活動(dòng)和設(shè)備運(yùn)行狀況。對(duì)于遠(yuǎn)程工作,跟蹤遠(yuǎn)程設(shè)備狀態(tài)很重要,因?yàn)榇蠖鄶?shù)用戶將在家中使用他們的端點(diǎn)設(shè)備。
- 操作系統(tǒng)日志: Windows、Linux 和其他操作系統(tǒng)默認(rèn)生成系統(tǒng)日志以顯示操作系統(tǒng)/服務(wù)器的運(yùn)行狀況以及它們?cè)诰W(wǎng)絡(luò)、應(yīng)用程序、硬件和其他組件之間的交互。用戶可以查看其操作系統(tǒng)上發(fā)生的情況,以報(bào)告并相應(yīng)地解決問題。
- 物聯(lián)網(wǎng) (IoT) 日志:物聯(lián)網(wǎng)是通過互聯(lián)網(wǎng)與其他設(shè)備交換數(shù)據(jù)的硬件設(shè)備。物聯(lián)網(wǎng)收集數(shù)據(jù),但它們沒有足夠的內(nèi)存空間來利用這些數(shù)據(jù)中的大部分,因此它們必須轉(zhuǎn)移到另一個(gè)存儲(chǔ)位置。IoT 日志包含有關(guān)設(shè)備組件的信息,例如傳感器和處理器以及傳入和傳出的數(shù)據(jù)。IT 管理員不僅可以對(duì)物聯(lián)網(wǎng)設(shè)備進(jìn)行故障排除,還可以對(duì)物聯(lián)網(wǎng)設(shè)備正在監(jiān)控的任何東西(石油鉆井平臺(tái)、制造工具等)進(jìn)行故障排除。
使用日志的好處
所有與 IT 相關(guān)的故障排除都需要日志才能開始調(diào)查。沒有它們,很難知道 IT 系統(tǒng)內(nèi)部發(fā)生了什么。監(jiān)控和分析日志有多種原因:
- 作為單一事實(shí)來源:大型企業(yè) IT 基礎(chǔ)架構(gòu)將生成數(shù)千條日志。因此,大多數(shù)公司將監(jiān)控工具集成到其 IT 基礎(chǔ)架構(gòu)中。這使他們能夠在單個(gè)儀表板中查看每個(gè) IT 系統(tǒng)的運(yùn)行情況。
- 分配系統(tǒng)資源: IT管理員或日志監(jiān)控軟件可以根據(jù)數(shù)據(jù)預(yù)測(cè)被跟蹤系統(tǒng)是否需要更多資源。如果 Web 應(yīng)用程序由于流量增加而需要更多 RAM 和帶寬,管理員可以在 Web 應(yīng)用程序爆發(fā)之前這樣做,因?yàn)樗鼪]有足夠的資源來處理不斷增長(zhǎng)的流量。
- 防止停機(jī)并節(jié)省資金:通過分析日志數(shù)據(jù)來預(yù)測(cè)當(dāng)前和未來的問題,公司可以按時(shí)主動(dòng)解決問題。這避免了業(yè)務(wù)運(yùn)營(yíng)停機(jī)并避免公司損失收入。
寫日志最佳實(shí)踐
監(jiān)控和分析日志是一個(gè)長(zhǎng)期的過程,需要考慮很多。為了設(shè)計(jì)一個(gè)好的日志監(jiān)控和分析操作,公司應(yīng)該遵循這些最佳實(shí)踐:
- 只監(jiān)控必要的:如果公司收集并存儲(chǔ)每一個(gè)日志數(shù)據(jù),它們將沒有存儲(chǔ)空間和 RAM 空間進(jìn)行分析。公司不僅應(yīng)該計(jì)劃他們應(yīng)該監(jiān)控哪些日志以獲得最佳價(jià)值,而且還應(yīng)該確定他們應(yīng)該多久清理一次過去檢查過的日志。
- 將日志數(shù)據(jù)上下文化:雖然不同的日志具有不同的格式,但您跟蹤的日志需要使用唯一標(biāo)識(shí)符進(jìn)行標(biāo)記以說明原因。網(wǎng)站上的一般點(diǎn)擊不同于“購買”點(diǎn)擊。
- 自動(dòng)事件關(guān)聯(lián)或 AIOps:現(xiàn)代企業(yè) IT 和云環(huán)境中有太多移動(dòng)部件。一個(gè) IT 問題可能與不同環(huán)境中的另一個(gè)問題相關(guān)。許多公司現(xiàn)在不再手動(dòng)查找問題,而是使用日志監(jiān)控軟件和AIOps 軟件來查找問題的根本原因。該軟件使用所有日志數(shù)據(jù)并將它們關(guān)聯(lián)起來以顯示一個(gè)系統(tǒng)如何影響另一個(gè)系統(tǒng)。這節(jié)省了 IT 團(tuán)隊(duì)解決問題并減少停機(jī)時(shí)間的時(shí)間。