Multi-Agent Graph Convolutional Reinforcement Learning for Dynamic Electric Vehicle Charging Pricing
電動汽車(ev)已經成為一種很有前途的低碳交通目標。雖然有大量的公共充電站可用,但這些充電站的使用往往是不平衡的,給充電站運營商(CSOs)帶來了許多問題。本文提出一種多智能體圖卷積強化學習(MAGC)框架,通過為每個不斷出現的收費請求提供動態定價,以優化多個長期商業目標,使公民社會組織能夠更有效地利用這些站點。具體而言,首先將充電站基于用戶需求的動態定價問題建模為一個混合競爭-合作的多智能體強化學習問題,每個充電站都是一個智能體;此外,通過將整個充電市場建模為一個動態異構圖,設計了一個多視圖異構圖注意力網絡,以融合智能體之間的多樣化關系所誘導的復雜相互作用。然后,提出一個共享元生成器,基于提取的元特征為大規模且多樣化的agent生成個性化定制的動態定價策略。最后,我們設計了一個對比異構圖池化表示模塊來學習一個濃縮而有效的狀態動作表示,以促進大規模智能體的策略學習。在兩個真實數據集上的大量實驗證明了MAGC的有效性,并實證表明,如果充電市場中的所有充電站都采用我們的動態定價政策,充電站的整體使用可以得到改善。
?
?
?
圖2顯示了magc的框架概述。首先,將每個充電站視為一個agent,將CSRSDP建模為混合競爭-合作MARL任務;然后,采用一種具有分散執行與集中訓練(DECT)架構的多智能體actor-critic方法,在大規模智能體上實現高效的分布式多智能體管理(dma)和有效的集中式多智能體策略學習(CMAPL)。具體而言,dma由一個多視圖異構圖注意力網絡(MVHGAT)模塊和一個共享元生成器模塊組成,該模塊對智能體之間的復雜相互作用進行建模,并根據提取的元特征為每個大規模智能體生成個性化定制的動態定價策略。在CMAPL中,設計了一個對比異構圖池化表示(CHGPR)模塊,用于從整個充電市場中學習智能體的精簡而有效的狀態動作表示。然后,critic利用該狀態動作表示學習大規模智能體的協調策略。在CMAPL完成后,實際中只需要dma即可實現高效的充電站動態定價。
總結
以上是生活随笔為你收集整理的Multi-Agent Graph Convolutional Reinforcement Learning for Dynamic Electric Vehicle Charging Pricing的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: SEO快排真的有效吗?什么样的快排才靠谱
- 下一篇: 阿里云如何安装部署Oracle11g 图