7月22日,在2025可信云大會上,騰訊云可觀測平臺通過《云計算系統(tǒng)智能化可觀測性能力成熟度模型》標準認證,獲評最高級——智能引領(lǐng)級(Lv5),標志著騰訊云可觀測平臺在智能化可觀測能力上達到業(yè)界先進水平。
據(jù)了解,該標準由中國信通院聯(lián)合國內(nèi)頭部云廠商、觀測廠商、各行業(yè)建設(shè)方共同編制,從全生命周期規(guī)范可觀測平臺的建設(shè)和運維,前瞻性提出智能化可觀測性的能力建設(shè)指引,內(nèi)容涵蓋可觀測能力底座、智能化場景應(yīng)用能力、可觀測智能體三大部分,共22個能力項,200+條能力指標。
,騰訊云可觀測平臺經(jīng)能力驗證、現(xiàn)場演示、專家評審,最終獲評智能引領(lǐng)級(Lv5)最高級,智能化場景應(yīng)用能力達到最高水平,同時具備自然語言檢索、自然語言可視化、自然語言分析問題、自然語言站內(nèi)輔助等智能體能力,使得觀測系統(tǒng)更加智能化和人性化,能夠更好地滿足業(yè)務(wù)需求。
一、騰訊云可觀測平臺技術(shù)破局
目前,騰訊云可觀測平臺 ?AI ?能力實現(xiàn)了三大技術(shù)破局:
1、Agent決策引擎:可以像管理員工自主性一樣來讓 AI 自主規(guī)劃、自我修正
2、三層測試體系:分層測試配合 Trace 和 BadCase 泛化,持續(xù)優(yōu)化質(zhì)量,減少幻覺
3、知識雙飛輪:讓 AI 工作臺覆蓋更廣更深的智能化場景,配備平臺知識庫,企業(yè)可自動知識庫,同時解決了知識沉淀、使用和更新的閉環(huán)問題,讓知識庫不只是知識庫,更是飛輪。
二、騰訊云可觀測平臺智能化能力
騰訊云可觀測平臺配備了 AI 工作臺,能夠通過「主動式隨機探索技術(shù)」,智能觀測隱藏風險,使用戶在真正發(fā)生故障的時候更加淡定,聚焦目標,快速解決問題。
目前騰訊云可觀測 AI 工作臺目前已實現(xiàn)了完整的【AI 探索】能力和【知識庫】能力。
AI 探索:AI 探索頁面支持可觀測全場景 AI 能力的統(tǒng)一探索,支持用戶對單一場景能力進行問答,同時也支持跨不同子產(chǎn)品的關(guān)聯(lián)分析,目標是承載全棧監(jiān)控數(shù)據(jù)的 AI 探索。
知識庫:騰訊云可觀測平臺基于騰訊經(jīng)驗為用戶提供了“通用”的平臺知識;也支持用戶上傳“專屬”的企業(yè)知識;平臺知識與企業(yè)知識共同賦能智能體,在知識應(yīng)用的過程中又產(chǎn)生新的可沉淀的“流動”知識,從而形成高速滾動的知識雙飛輪體系。
三、重點場景
(1)告警分析報告
針對告警風暴,支持基于 AI 進行全量的告警歷史分析與相關(guān)資源指標分析,發(fā)現(xiàn)異常的告警策略與云產(chǎn)品資源,分析原因并給出優(yōu)化建議。同時可固化為工作流定期進行AI分析,用戶可收到結(jié)果報告。
(2)應(yīng)用服務(wù)健康檢查
AI 自動查詢應(yīng)用異常或耗時長的情況,并針對問題進一步進行相關(guān)接口的分析,以及下鉆到 tracid 的鏈路詳情的分析、底層依賴資源的分析,發(fā)現(xiàn)根因問題并給出解決建議,極大提高問題排查效率。
(3)應(yīng)用異常關(guān)聯(lián)日志與資源分析
基于多個智能體的原子能力,實現(xiàn)了應(yīng)用異常信息與關(guān)聯(lián)日志數(shù)據(jù)、底層云產(chǎn)品資源數(shù)據(jù)的關(guān)聯(lián)分析,免去用戶手動在不同的數(shù)據(jù)間切換查看。
(4)云產(chǎn)品資源利用情況分析
免去盯盤的煩惱,AI 幫助用戶自動查詢并分析云服務(wù)器的資源利用率指標,快速發(fā)現(xiàn)問題給出建議,優(yōu)化成本。
(5)Prometheus集群告警配置完善度分析
實現(xiàn)了 AI 自動對當前已有的告警規(guī)則與告警歷史進行分析,發(fā)現(xiàn)告警未覆蓋或告警配置錯誤的問題,幫助用戶建立完善的告警體系,保證壁壘的穩(wěn)固防護。
(6)通用問答通用
問答目前主要基于騰訊云可觀測平臺官方文檔的內(nèi)容,為用戶提供基于 AI 的快速檢索能力,當前支持的文檔范圍為基礎(chǔ)監(jiān)控、應(yīng)用性能監(jiān)控和 Prometheus 監(jiān)控。
四、如何使用
| 三步開啟智能運維
1、?一鍵啟用:在可觀測控制臺點擊「AI 工作臺-AI 探索」,開始探索之旅;
2、?知識注入:在「AI 工作臺-知識庫」上傳企業(yè)知識,構(gòu)建專屬知識飛輪;
3、場景驗證:
騰訊云可觀測平臺 AI 能力將智能體的“隨機性”轉(zhuǎn)化為運維收益,重新定義可觀測性的價值邊界——?從被動告警到主動防御,從數(shù)據(jù)堆砌到智慧生成,從僵化修補到全面觀測。
五、騰訊云一體化可觀測解決方案
騰訊云可觀測平臺(Tencent Cloud Observability Platform,TCOP)基于指標、鏈路、日志、事件的全類型監(jiān)控數(shù)據(jù),結(jié)合強大的可視化和告警能力,為用戶提供一體化監(jiān)控解決方案。滿足全鏈路、端到端的統(tǒng)一監(jiān)控訴求,提高運維排障效率,為業(yè)務(wù)的健康和穩(wěn)定保駕護航!
可信云大會由中國通信標準化協(xié)會主辦,中國信通院承辦,洞察科技與行業(yè)發(fā)展的最新動態(tài),全面展示中國信通院在云計算與AI融合領(lǐng)域的研究、探索與實踐,是連接現(xiàn)在與未來、技術(shù)與應(yīng)用、中國與世界的重要橋梁與窗口平臺。
(推廣)
