天猫系统的流控降级
目錄
1交易應用介紹
2系統挑戰及應對
3優雅降級思路
4心得總結
交易應用介紹
?
購物袋
?
下單
?
確認訂單
系統挑戰及應對
挑戰
? 高并發
? 低時延
? 容量有限
? 多外部系統協力&下單信息準確
目標
? 不掛掉
– 不因為容量原因導致網站癱瘓
– 自身的容量
– 后端系統的容量
問題
? 高壓力情況下,有限的容量為什么不能處 理有限的請求?
– IO瓶頸
– 數據熱點
– 線程模型
– 排隊
– 超時
?
應對
思路
主動拒絕
? 減少系統內的排隊
? 盡可能早地拒絕
優雅降級
? 應用分業務做服務拒絕
? 業務分功能點做服務拒絕
優雅降級思路
? 優雅降級,我們需要知道什么? – 業務優先級
? 根據業務目標,哪些業務是不重要的 – 每個業務所包含的功能點(包括分支功能點)
? 根據業務目標,哪些功能點是不重要的 – 每個功能點所關聯的外部系統容量
? 某點出現瓶頸的時候,停掉該功能點,能否減少 該點的壓力
監控指標
? 需要監控什么? – 流量(proactive)
? 到該應用的流量
? 該應用調用其它系統(包括db、tair等)的流量
? 每個應用流量監控粒度 – 分目標(來源)應用,分接口、分業務,分功能點 – 匯聚&鉆取 – 其它指標(reactive)
? RT ? Load、CPU、mem、network、disk、…
Tmalleye監控
? 核心功能 – 實時,分業務獲取應用的第一手資料
? 并發度
? qps
? rt
? 訪問次數統計
– 控制
? 按比例的降級開關控制(手工開關+閾值開關)
? 彈性更好的跨業務容量隔離
交易降級方案
交易降級預案
心得總結
?
?
?
?
?
?
總結
- 上一篇: STM32 定时器中断
- 下一篇: xp系统之家官网纯净版系统下载