日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

强化学习平台安装 Mujoco、mujoco-py、gym、baseline

發(fā)布時(shí)間:2024/8/1 编程问答 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 强化学习平台安装 Mujoco、mujoco-py、gym、baseline 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

日萌社

人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度學(xué)習(xí)實(shí)戰(zhàn)(不定時(shí)更新)


Mujoco 安裝1.MuJoCo是一個(gè)物理模擬器,可以用于機(jī)器人控制優(yōu)化等研究。官網(wǎng)下載MuJoCo 2.0 對(duì)應(yīng)平臺(tái)的安裝包:https://www.roboti.us/index.html 中的 mujoco200 linux安裝包mkdir ~/.mujococp mujoco200_linux.zip ~/.mujococd ~/.mujocounzip mujoco200_linux.zip注意:必須把 ~/.mujoco/mujoco200_linux 修改為 ~/.mujoco/mujoco200,不論解壓出來(lái)的文件名是什么都必須改為mujoco200,因?yàn)閕mport mujoco_py的時(shí)候,會(huì)報(bào)錯(cuò) You appear to be missing MuJoCo. We expected to find the file here: /home/用戶名/.mujoco/mujoco200正是因?yàn)槟J(rèn)只從~/.mujoco/mujoco200這個(gè)路徑找。2.注冊(cè)通過(guò)郵件獲取注冊(cè)碼License文件:https://www.roboti.us/license.html注意:MuJoCo 為收費(fèi)的,30 days免費(fèi),下載免費(fèi)30天的license,可以申請(qǐng)獲取學(xué)生免費(fèi)license,可以試用1年僅限教育郵箱,所以如果你有教育郵箱的話,就可以申請(qǐng)1年的試用期。1.Computer id填寫框旁邊點(diǎn)擊下載對(duì)應(yīng)平臺(tái)的獲取Computer id的程序此處下載的是linux平臺(tái)的getid_linux可執(zhí)行文件chmod 777 getid_linux ./getid_linux 2.提交注冊(cè)信息后,收到郵件,下載附件:LICENSE.txt、mjkey.txt3.拷貝許可證:cp mjkey.txt ~/.mujococp mjkey.txt ~/.mujoco/mujoco200/bin4.添加環(huán)境變量vim ~/.bashrcexport LD_LIBRARY_PATH=~/.mujoco/mujoco200/bin${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}export MUJOCO_KEY_PATH=~/.mujoco${MUJOCO_KEY_PATH}使配置馬上生效 source ~/.bashrc 5.測(cè)試是否安裝成功:進(jìn)入bin目錄下 即可運(yùn)行simulate 打開軟件界面cd ~/.mujoco/mujoco200/bin./simulate ../model/humanoid.xml

mujoco200_linux 安裝后運(yùn)行 simulate 的圖像?


mujoco-py 安裝 1.更新、安裝依賴項(xiàng)(可選擇是否更新、安裝)sudo apt-get updatesudo apt-get upgradesudo DEBIAN_FRONTEND=noninteractive apt-get install -y curl git libgl1-mesa-dev libgl1-mesa-glx libglew-dev libosmesa6-dev python3-pip python3-numpy python3-scipy net-tools unzip vim wget xpra xserver-xorg-dev sudo apt-get install -y python-numpy python-dev cmake zlib1g-dev libjpeg-dev xvfb libav-tools xorg-dev python-opengl libboost-all-dev libsdl2-dev swig2.安裝 mujoco-py1.下載mujoco-py源碼包然后解壓直接mujoco-py源碼包:https://github.com/openai/mujoco-py或者 用git下載mujoco-py源碼包:git clone https://github.com/openai/mujoco-py.gitsudo apt install git #安裝 git2.安裝依賴cd ~/mujoco-py 或者為 cd ~/mujoco-py-masterpip3 install -r requirements.txtpip3 install -r requirements.dev.txt3.安裝方式一:pip3 install -U 'mujoco-py<2.1,>=2.0'報(bào)錯(cuò):Could not build wheels for mujoco-py which use PEP 517 and cannot be installed directly解決:pip install --no-use-pep517 'mujoco-py<2.1,>=2.0'報(bào)錯(cuò):No such file or directory: 'patchelf': 'patchelf'解決:sudo apt-get update -ysudo apt-get install -y patchelf4.安裝方式二:cd ~/mujoco-py/vendor 或者為 cd ~/mujoco-py-master/vendor./Xdummy-entrypointcd ..注意:使用python、pip命令安裝時(shí),應(yīng)注意你的python、pip命令對(duì)應(yīng)的是python的什么版本,否則可能會(huì)默認(rèn)使用python2,同時(shí)也要注意mujoco-py安裝到是哪個(gè)版本的python環(huán)境,后面運(yùn)行mujoco-py的庫(kù)代碼就必須該python版本的環(huán)境。sudo python3 setup.py install 報(bào)錯(cuò):ImportError: No module named setuptools解決:sudo apt-get install python-setuptools5.測(cè)試是否安裝成功例子1:import mujoco_pyimport osmj_path, _ = mujoco_py.utils.discover_mujoco()xml_path = os.path.join(mj_path, 'model', 'humanoid.xml')model = mujoco_py.load_model_from_path(xml_path)sim = mujoco_py.MjSim(model)print(sim.data.qpos)#[0. 0. 1.4 1. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.# 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. ]sim.step()print(sim.data.qpos)#[-1.12164337e-05 7.29847036e-22 1.39975300e+00 9.99999999e-01# 1.80085466e-21 4.45933954e-05 -2.70143345e-20 1.30126513e-19# -4.63561234e-05 -1.88020744e-20 -2.24492958e-06 4.79357124e-05# -6.38208396e-04 -1.61130312e-03 -1.37554006e-03 5.54173825e-05# -2.24492958e-06 4.79357124e-05 -6.38208396e-04 -1.61130312e-03# -1.37554006e-03 -5.54173825e-05 -5.73572648e-05 7.63833991e-05# -2.12765194e-05 5.73572648e-05 -7.63833991e-05 -2.12765194e-05]5.測(cè)試是否安裝成功例子2:cd ~/mujoco-py/examples/python3 setting_state.py

測(cè)試是否安裝mujoco-py的成功例子?

?mjpro150_linux 安裝后運(yùn)行 simulate 的圖像


gym 安裝1.sudo apt install git #安裝 git2.git clone https://github.com/openai/gym.git #拉取源代碼cd ~/gympip install -e '.[all]' # 安裝 Gym1.報(bào)錯(cuò):注意該gym版本要求安裝的是mjpro150You appear to be missing MuJoCo. We expected to find the file here: /home/nagisa/.mujoco/mjpro150 2.解決:類似安裝mujoco200 linux一樣的步驟1.官網(wǎng) https://www.roboti.us/index.html 下載 mjpro150 linux安裝包mkdir ~/.mujococp mjpro150_linux.zip ~/.mujococd ~/.mujocounzip mjpro150_linux.zip2.拷貝許可證:cp mjkey.txt ~/.mujococp mjkey.txt ~/.mujoco/mjpro150/bin3.添加環(huán)境變量:vim ~/.bashrcexport LD_LIBRARY_PATH=~/.mujoco/mjpro150/bin${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}export MUJOCO_KEY_PATH=~/.mujoco${MUJOCO_KEY_PATH}使配置馬上生效 source ~/.bashrc4.測(cè)試是否安裝成功:cd ~/.mujoco/mjpro150/bin./simulate ../model/humanoid.xml3.測(cè)試是否安裝成功例子1:import gymenv = gym.make("CartPole-v1") # 創(chuàng)建游戲環(huán)境observation = env.reset() # 游戲回到初始狀態(tài)for _ in range(1000):env.render() # 顯示當(dāng)前時(shí)間戳的游戲畫面action = env.action_space.sample() # 隨機(jī)生成一個(gè)動(dòng)作# 與環(huán)境交互,返回新的狀態(tài),獎(jiǎng)勵(lì),是否結(jié)束標(biāo)志,其他信息observation, reward, done, info = env.step(action)if done:#游戲回合結(jié)束,復(fù)位狀態(tài)observation = env.reset()env.close()4.測(cè)試是否安裝成功例子2:import gymenv = gym.make('Hero-ram-v0')for i_episode in range(20):observation = env.reset()for t in range(100):env.render()print(observation)action = env.action_space.sample()observation, reward, done, info = env.step(action)if done:print("Episode finished after {} timesteps".format(t+1))break

測(cè)試是否安裝成功gym的例子1?

測(cè)試是否安裝成功gym的例子2


baseline 安裝OpenAI Baseline是一系列高質(zhì)量的強(qiáng)化學(xué)習(xí)控制算法,需要python>=3.5,且需要OpenMPI和zlib,有些Baseline example是基于Mujoco 物理仿真環(huán)境的。1.baseline 安裝git clone https://github.com/openai/baselines.gitcd ~/baselinespip install -e .2.在baseline 中對(duì)算法進(jìn)行測(cè)試,需要安裝pytestpip install pytest3.測(cè)試是否安裝成功cd ~/baselines/baselines/her/experiment#play.py為調(diào)用訓(xùn)練好的參數(shù)進(jìn)行執(zhí)行python play.py policy_best.pkl (后面需要跟著訓(xùn)練好的參數(shù)文件)注意:還必須安裝 Nvidia驅(qū)動(dòng)、tensorflow-gpu、CUDA、cuDNNpip install tensorflow-gpuimport tensorflow as tfprint(tf.__version__)

總結(jié)

以上是生活随笔為你收集整理的强化学习平台安装 Mujoco、mujoco-py、gym、baseline的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。