D4RL環境の概要とWindowsでのインストール手順(非推奨)

D4RL(DeepMind Control Suite for Offline Reinforcement Learning)は、オフライン強化学習のための標準化されたデータセットと環境を提供するライブラリです。ただし、Windowsネイティブ環境でのインストールは多くの依存関係やビルドツールの互換性問題により困難です。

重要注意:WindowsではD4RLの安定動作が保証されていません。代わりにWSL2(Windows Subsystem for Linux)の利用を強く推奨します。WSL2上ではLinuxと同等の環境が構築でき、サーバーとの互換性も高く、VS CodeなどのIDEからもシームレスに接続可能です。

Windows環境での試行的インストール手順(MuJoCo 2.1.0対応)

1. PyTorchのインストール

強化学習実験の基盤としてPyTorchが必要です。PythonバージョンとCUDAバージョンに注意してインストールしてください。例:

torch==1.13.1+cu117
torchaudio==0.13.1+cpu
torchvision==0.14.1+cu117

2. MuJoCoの設定

  1. MuJoCo公式GitHubからバイナリ(mujoco210.zip)をダウンロードし、C:\mujoco に展開。
  2. 環境変数 PATHC:\mujoco\bin を追加。
  3. コマンドプロンプトで simulate を実行し、GUIウィンドウが起動すれば成功。
  4. 次にPythonバインディングである mujoco-py をインストール:
    • 事前に「Visual Studio C++ ビルドツール」とCMakeをインストール。
    • 以下のコマンドでインストール:
    pip install mujoco-py==2.1.2.14

    Pythonインタプリタで import mujoco_py がエラーなく実行できればOK。

3. D4RLの依存ライブラリ導入

  • Gym / Gymnasium
    D4RLは古いGym APIに依存するため、通常は以下をインストール:
    pip install gym==0.21.0
    (最新のGymnasiumとは互換性がない場合がある)
  • mjrl
    GitHubからの直接インストールは不安定なため、ローカルZIPをダウンロードし、解凍後インストール:
    cd C:\mjrl
    pip install .
  • その他の依存パッケージ(国内ミラー使用推奨):
    pip install numpy==1.24.4 h5py==3.11.0 termcolor==1.1.0 pybullet==3.2.7 click==8.1.8 -i https://pypi.tuna.tsinghua.edu.cn/simple

4. D4RL本体のインストール

  1. D4RLのソースコードをZIPでダウンロードし、C:\d4rl に展開。
  2. setup.py 内の install_requires を以下のように修正(コメントアウトで不要な依存を除外):
    install_requires=[
        "gym<0.24.0",
        "dm_control>=1.0.3",
    ]
    ※ 既に手動でインストール済みのパッケージ(numpy, mujoco_pyなど)は削除またはコメントアウト。
  3. 編集モードでインストール:
    cd C:\d4rl
    pip install -e .

この手順でも多くのユーザーがビルドエラーやDLLロード失敗に直面します。安定した開発環境を確保するには、WSL2上でUbuntuを用いたLinux環境構築が現実的な選択です。

タグ: D4RL MuJoCo mujoco-py gym WSL2

5月23日 03:30 投稿