SGE 节点处于E状态
生活随笔
收集整理的這篇文章主要介紹了
SGE 节点处于E状态
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
SGE集群可能出現獨列錯誤狀態。此時,使用命令 qstat -f 檢測集群隊列隊列狀態。最后一列stats若為空,則表示隊列狀態正常,可以用于任務提交。其它狀態解釋如下:
a: 負載超限了,開啟警報alarm。
A: 超限暫替,開啟警報Alarm。
E: 隊列有錯誤,不能提供任務提交服務了。
au:主機和SGE系統連接中斷,此時負載狀態為-NA-。需要重啟相應服務器的sgeexecd命令。
當節點處于E狀態時,需要使用root用戶在對應的主機中重啟sge計算服務:
/opt/sysoft/sge/default/common/sgeexecd restart
然后,清除隊列中的錯誤信息:
qmod -c all.q
來自為知筆記(Wiz)
總結
以上是生活随笔為你收集整理的SGE 节点处于E状态的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 2016全球资产配置白皮书(附下载)
- 下一篇: css3 unset属性