阿里云与达摩院合作 AHPA 弹性预测论文被顶会 ICDE 录用
近日,阿里云容器服務團隊與達摩院數據決策團隊合作的論文《RobustScaler: QoS-Aware Autoscaling for Complex Workloads》被數據管理與數據庫國際頂級會議 ICDE 2022 長文錄用。ICDE 和 SIGMOD、VLDB 并稱為數據庫領域的三大國際頂尖學術會議,入選中國計算機學會(CCF)推薦 A 類國際會議列表。
阿里云容器服務 ACK 管理著海量的 Kubernetes 集群,在集群管理、集群運維等領域積累了豐富的經驗,并構建了智能運維平臺 CIS(Container Intelligence Service),旨在通過智能化手段解決運維難題。達摩院數據決策團隊在時間序列分析/預測/異常監測/AIOps 方向深耕多年,數十篇文章發表在 KDD, SIGMOD, ICDE, AAAI 等頂會和多篇中美專利,獲得 2022 ICASSP AIOps Challenge 冠軍等多個國際獎項。
如今,企業業務流量往往呈現出明顯的波峰、波谷形態,如果采用固定實例數會存在極大的資源浪費。為應用配置彈性伸縮是提升資源利用率的有效方式。
Kubernetes 中現有的彈性伸縮策略如 HPA、CronHPA 等都存在彈性觸發滯后的問題,導致應用的服務質量下降。如何在保證應用服務質量的前提下,根據應用的歷史數據,基于時序算法提前進行擴縮容呢?
為解決該問題,我們在論文中提出了一種基于非齊次柏松過程(NHPP)和隨機約束優化的智能彈性框架 RobustScaler。此外,研發了一種專門的交替方向乘子法 (ADMM) 來有效地訓練 NHPP 模型,并證明了基于優化的主動策略可以保證應用的服務質量。 大量實驗表明,RobustScaler 在各種實際場景中優于常見的自動伸縮策略,并且在具有復雜周期性的應用中也表現優異。
RobustScaler 算法已經應用于智能運維平臺 CIS 的 AHPA 組件中。智能運維平臺 CIS 由異常發現、異常定位、異常修復、異常預測四大模塊組成,包含定時巡檢、網絡診斷、運行時診斷、CVE 漏洞修復、應用配置優化等眾多功能。AHPA 是 CIS 的核心組件之一,組件架構如下圖所示,AHPA 彈性策略可分為主動預測和被動預測。主動預測從歷史數據中識別周期性趨勢,主動預測下個周期應用的實例數量;被動預測基于應用實時數據設定實例數量,可以很好的應對突發流量。此外,AHPA 還增加了兜底保護策略,用戶可以設置實例數量的上下界。AHPA 算法中最終生效的實例數是主動預測、被動預測及兜底策略中的最大值。
AHPA 組件正在公測中,點擊申請白名單[1],歡迎大家試用并提寶貴意見。
點擊此處查看阿里云容器服務 AHPA 彈性預測產品文檔詳情。當前 AHPA 已開啟用戶邀測,歡迎感興趣的用戶點擊文檔中“提交工單”位置申請白名單,期待您的試用及反饋。
相關鏈接
[1]申請白名單https://help.aliyun.com/document_detail/412229.html
總結
以上是生活随笔為你收集整理的阿里云与达摩院合作 AHPA 弹性预测论文被顶会 ICDE 录用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 阿里云微服务引擎 MSE 2022 年
- 下一篇: OpenKruise v1.1:功能增强